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PRÉFACE 





La physique moderne est née au début du siècle dernier, lorsque les conceptions sur 
lesquelles était basée la connaissance du monde ont été bouleversées par quelques 
observations apparemment disparates concernant la lumière. Celle-ci semblait bien 
comprise et expliquée par les équations établies 1l y a cent cinquante ans par Maxwell, 
considérées comme l’aboutissement triomphal de la physique classique. Et pourtant, 
c’est en se posant des questions profondes sur la lumière, sa vitesse de propagation, la 
nature de l’onde qui la constitue, et sur certains phénomènes lumineux devenus acces- 
sibles à l’expérience — la distribution en fréquence de la lumière des corps chauffés, 
les propriétés de l’effet photoélectrique, le caractère discret des spectres absorbés ou 
émis par la matière — que les physiciens ont au début du XX° siècle complètement 
révolutionné notre vision du monde. La relativité restreinte, en introduisant l’idée 
que la vitesse de la lumière ne dépend pas de l’observateur et en admettant la vitesse 
maximale de propagation de toute information, devait bouleverser notre conception 
de l’espace et du temps, ainsi que notre vision de l’univers et de la cosmologie lors- 
qu’elle fut étendue à la description des effets de gravitation dans le cadre de la re- 
lativité générale. Par ailleurs, en montrant que la lumière était à la fois une onde et 
un ensemble de particules (les photons), la théorie quantique nous introduisait dans 
le monde étrange de la physique de l’infiniment petit, celui où les notions d’onde et 
de corpuscules sont indissociablement mêlées, nous livrant les clés du monde micro- 
scopique. Albert Einstein est au point de départ de ces deux révolutions puisque la 
relativité restreinte et la physique quantique sont nées de deux articles qu’il a publiés 
en 1905 — année miraculeuse pour la science — et qu’on lui doit aussi la théorie de la 
relativité générale établie dix ans plus tard. 

Fondamentale pour notre compréhension profonde de la nature, la physique quan- 
tique est aussi à la base de toutes les technologies modernes omniprésentes dans 
notre vie quotidienne. Sans physique quantique, 1l n’y aurait ni lasers, n1 transistors, 
ni ordinateurs, ni imagerie médicale par résonance magnétique. Dans certains cas, la 
relativité joue également un rôle essentiel dans notre vie quotidienne. Par exemple, le 
GPS, système de navigation universel qui nous permet de nous repérer par triangula- 
tion n’importe où sur Terre avec une précision de quelques mètres, exploite à la fois 
la physique quantique nécessaire à la compréhension du fonctionnement des horloges 
atomiques, et la relativité, restreinte et générale, sans laquelle les mesures du temps 
nécessaires aux opérations de triangulation seraient entachées de larges erreurs. Les 
centrales nucléaires, sources d’énergie essentielle de notre monde contemporain, sont 
un autre exemple de réalisations qui auraient été impossibles sans les connaissances 
que nous ont apportées les théories de la relativité et de la physique quantique. 
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Il est paradoxal que ces théories dont l’importance est capitale paraissent ésoté- 
riques au public non spécialisé et soient encore considérées comme d’accès difficile 
dans l’enseignement, au point que leur étude quantitative soit repoussée tardivement 
dans le cursus des étudiants. Il est vrai que les concepts quantiques et relativistes 
peuvent être déroutants car ils concernent des phénomènes à des échelles de vitesses 
ou de distances inhabituelles à la perception de nos sens. Les mathématiques né- 
cessaires à la compréhension de cette physique sont cependant relativement élémen- 
taires, à la portée d’un élève des classes terminales scientifiques. 


Les auteurs de ce livre ont trouvé la bonne façon d’expliquer comment ces 
concepts sont nés, en présentant le caractère logique des déductions ayant amené 
Einstein et ses collègues à la conclusion que les lois étranges de la relativité et du 
monde quantique devaient s’imposer. Et ils ont su accompagner les idées physiques 
du formalisme mathématique simple et rigoureux qui les traduit pour permettre le 
calcul d’effets physiques fondamentaux. Par-là, ils révèlent aux étudiants et à un pu- 
blic bien plus large la beauté de la théorie, initiant le lecteur à un monde dans lequel 
les concepts dont il a parfois entendu parler de façon qualitative trouvent leur place 
naturelle. La présentation en regard, dans un même volume, des deux révolutions qui 
ont changé notre vision du monde est également une heureuse innovation par rapport 
à la plupart des ouvrages qui séparent les deux questions. Il est en effet naturel de 
parler du photon en introduisant des notions de relativité, ne serait-ce que parce que 
la relation de Planck entre énergie et fréquence du quantum de lumière n’est, comme 
Louis de Broglie l’a reconnu, que l’une des composantes d’une relation vectorielle 
relativiste plus générale qui associe également, pour toute particule et pas seulement 
le photon, l’impulsion à la longueur d’onde de l’onde associée. 


En quelque deux cent cinquante pages illustrées de figures très parlantes et 
émaillées d’encarts précisant des points importants sans couper le fil de la discus- 
sion générale, les auteurs ont réalisé la gageure de couvrir un champ immense, en 
équilibrant une approche théorique simple, la description d’expériences souvent très 
récentes, et celle d’appareils ou de dispositifs de notre vie quotidienne. Ainsi, le 
lecteur comprend le lien profond entre recherche fondamentale et innovation et la 
nécessité de la première comme condition essentielle du développement de la se- 
conde. En ces temps où cette complémentarité n’est pas toujours bien comprise, ce 
livre joue ainsi un rôle d’éducation salutaire. J’ai également trouvé très positive la 
démarche consistant à décrire de vraies expériences et non pas des expériences de 
pensée pour analyser les concepts de base, et l’utilisation résolument moderne du 
langage de la théorie de l’information pour parler des concepts essentiels de la re- 
lativité et de la physique quantique. Tout à fait remarquable, enfin, est le point de 
vue pris par les auteurs de décrire une science en évolution, ouverte, qui pose encore 
de nombreuses questions non résolues dans les domaines de l’infiniment petit et de 
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l’infiniment grand. Il est bon que tout étudiant s’intéressant à ces questions puisse se 
les poser et qu’il ait entendu parler d’ondes de gravitation, de matière et d’énergie 
noire. Au moins sur ces plans, il en sait presque autant que les auteurs du livre et les 
maîtres qui lui enseignent la science connue... et cela peut l’inspirer en lui montrant 
qu'il reste encore en physique des terres vierges à explorer. 

Ce livre sera extrêmement utile aux étudiants comme première approche à la phy- 
sique moderne, aux enseignants qui y puiseront beaucoup d’idées pédagogiques pour 
leurs cours, ainsi qu'aux lecteurs curieux qui y trouveront une source d’information 
très riche pour compléter leur culture scientifique. Claude Fabre, Charles Antoine 
et Nicolas Treps y ont mis toute leur expérience d’enseignants de la physique et de 
chercheurs passionnés par la découverte encore si riche du monde des atomes et des 
photons. Spécialistes de la physique quantique, ils sont particulièrement bien placés 
pour nous parler des révolutions que l’étude de la lumière a déclenchées il y a un peu 
plus d’un siècle... 


Serge Haroche 
Collège de France, 
Prix Nobel de Physique 2012 
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AVANT-PROPOS 





Cet ouvrage est issu d’un cours enseigné en deuxième année de licence à l’Université 
Pierre-et-Marie Curie Paris-Sorbonne Universités, ayant pour but d’initier les étu- 
diants aux deux grands « piliers » de la physique actuelle que sont la relativité et la 
physique quantique. Il présente, au niveau le plus élémentaire possible, les concepts 
de base de ces deux théories et les illustre par de nombreux résultats expérimentaux 
récents. Il cherche avant tout à introduire les idées et outils essentiels nécessaires à 
la compréhension de ces domaines de la physique, en laissant volontairement de côté 
certains détails techniques ou théoriques qui font l’objet d'enseignements ultérieurs. 
Il vise également à permettre aux lecteurs d’accéder à des domaines de la physique 
qui sont à l’origine de recherches extrêmement actives dans les laboratoires de phy- 
sique du monde entier. 

Il s’adresse donc à toutes les personnes désireuses de s’initier à la « physique mo- 
derne », et de comprendre les bases et les enjeux de ses développements actuels : 
en premier lieu les étudiants de licence de physique, mais aussi ceux de licence de 
mathématique et de chimie, les étudiants des classes préparatoires et d’écoles d’in- 
génieurs et ceux préparant les concours de recrutement de professeurs de physique et 
chimie. Il sera certainement aussi très utile à tous les enseignants de physique dési- 
reux de renforcer leurs connaissances dans des domaines qui sont maintenant abordés 
à un niveau élémentaire dans les nouveaux programmes des lycées. 

Les différents chapitres de ce manuel comportent des encarts qui ne sont pas in- 
dispensables à la compréhension des sujets abordés lors d’une première lecture. Ils 
permettent de les mettre en perspective ou bien détaillent certains calculs. Enfin, nous 
proposons à la fin de l’ouvrage des exercices et problèmes qui permettront au lecteur 
d’appliquer les concepts introduits et de les illustrer par des exemples. Les corrigés 
détaillés sont téléchargeables sur la page dédiée à l’ouvrage sur dunod.com. 
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INTRODUCTION 


La physique s’est élaborée au cours des siècles à partir d’observations de phéno- 
mènes naturels, puis d’expérimentations, c’est-à-dire de mesures quantitatives réali- 
sées dans des conditions les plus contrôlées possibles. Celles-ci ont permis de dégager 
des grandeurs physiques caractéristiques, puis des corrélations quantitatives entre ces 
grandeurs, qui ont souvent pu souvent être écrites sous forme de lois mathématiques. 
Ces lois permettent à leur tour de prédire de nouveaux phénomènes et conduisent à 
de nouvelles expériences. Elles permettent en outre de concevoir et de mettre au point 
des applications technologiques. 

D'abord relatives à des domaines restreints de phénomènes, ces lois ont été au fil 
des siècles englobées dans des ensembles cohérents de plus en plus vastes, dans les- 
quels elles apparaissent comme les conséquences d’un nombre de plus en plus réduit 
de principes de base. La physique est ainsi le résultat d’un processus essentiellement 
cumulatif : ses développements s’élaborent sur « les épaules des géants », que sont 
les physiciens des siècles passés, selon la magnifique expression de Newton. 

Il arrive qu’une expérimentation conduise à un résultat en contradiction avec les 
prédictions faites à partir de ces lois. Ce grain de sable dans l’ensemble des expli- 
cations physiques admises à un moment donné est l’indice qu’il faut modifier d’une 
manière ou d’une autre les principes de base, voire en changer totalement. Ce sont 
alors les prémices de ce qu’on appelle une « révolution scientifique ». Les physiciens 
doivent alors abandonner les certitudes anciennes et imaginer de nouvelles explica- 
tions du monde. C’est un exercice intellectuel extraordinairement difficile dont seuls 
sont capables les plus grands esprits. 

Les nouveaux principes mis progressivement en place, au prix d’intuitions gé- 
niales et de tâtonnements multiples, doivent alors non seulement rendre compte des 
nouveaux phénomènes observés, mais aussi englober comme cas particulier les phé- 
nomènes expliqués par l’ancienne théorie. Ils permettent aussi de prédire des phéno- 
mènes nouveaux, et d'élaborer de nouvelles technologies. 

Le début du XX° siècle a été le théâtre pratiquement simultané de deux de ces révo- 
lutions. On donne le nom de « théorie de la relativité » et de « mécanique quantique » 
aux deux nouveaux cadres conceptuels mis en place à l’issue de ces révolutions. Ces 
deux théories ont connu un immense succès, car elles ont permis de rendre compte 
avec une extrême précision de la quasi-totalité des phénomènes physiques connus. 
Au moment où nous écrivons ces lignes, certains phénomènes restent inexpliqués et 
font l’objet de recherches intenses, comme la supraconductivité à haute température 
ou la vitesse de rotation des galaxies. L’explication de ces phénomènes est cherchée 
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en général dans le cadre de l’une ou l’autre de ces deux théories. Certains cherchent 
de nouveaux cadres conceptuels. Mais, à notre connaissance, aucune observation ex- 
périmentale indiscutablement admise par la communauté des physiciens n’est actuel- 
lement en contradiction avec les prédictions de ces théories. Cette affirmation ne sera 
peut-être plus vraie demain, ou dans un siècle. 


Partie 1 


Relativité 
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ESPACE, TEMPS 
ET MOUVEMENT 
EN PHYSIQUE 





Les lois régissant le mouvement des corps ont été pendant longtemps basées sur 
des « évidences » : le temps était « absolu », ou universel : il s’écoulait partout de 
la même manière. Les distances entre différents points d’un solide avaient aussi un 
caractère absolu, au point de pouvoir servir d’étalon de définition du mètre. Une 
force appliquée pendant un temps suffisamment long était susceptible, pensait-on, 
d’accélérer sans limite un corps matériel. La masse d’un corps était aussi considérée 
comme une caractéristique absolue. 


Jusqu’à la fin du XIX® siècle, il paraissait impensable qu’il en fût autrement. Nous 
savons maintenant que ces « évidences » étaient des erreurs, et que le temps, l’espace 
et le mouvement sont en fait des concepts plus subtils : le « tic-tac » d’une horloge 
n’est pas le même si on le mesure sur une horloge au repos ou en mouvement par 
rapport à l’observateur. Il en est de même pour le « mètre étalon », dont la longueur 
n’a pas la même valeur selon qu’il se déplace ou non par rapport à l’appareil de 
mesure. Nous savons aussi qu’il existe une vitesse limite, celle de la lumière, pour le 
mouvement de n’importe quel objet matériel. Enfin, la masse d’un corps peut varier 
et se transformer en énergie utilisable. 


Cette mise à mal de nos certitudes est venue paradoxalement d’interrogations sur 
une autre partie de la physique, l’électromagnétisme, qui inclut l’étude des phéno- 
mènes lumineux : l’article d’Einstein considéré comme fondateur de la théorie de 
la relativité a pour titre « Sur l’électrodynamique des corps en mouvement ». Il pro- 
pose comme point de départ une nouvelle « évidence », contraire à l’intuition mais 
indispensable pour la cohérence d’ensemble des lois expliquant les phénomènes phy- 
siques : l’existence d’une quantité absolue d’un autre type, la vitesse de propagation 
de la lumière dans le vide, qui ne dépend pas de l’état de mouvement de l’objet qui 
lui donne naissance. L’unité de longueur est maintenant liée à ce nouveau point de 
vue : elle est en effet définie comme la distance parcourue par la lumière pendant un 
intervalle de temps bien défini. 


Au début du XX siècle, ce renversement des évidences est apparu plus conceptuel 
que pratique, car il impliquait des comportements vraiment nouveaux uniquement 
pour les objets physiques se déplaçant à une très grande vitesse par rapport à nos 
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Figure |.1- Constellation des satellites GPS. 
(source libre : http://www.gps.gov/multimedia/images/) 


appareils de mesure, de l’ordre de 100 000 km.s”!, irréalisable expérimentalement. 
Ce n’est plus le cas maintenant, au début du XXI siècle, et ceci pour deux raisons : 


e les progrès des technologies permettent maintenant de réaliser des mesures de dis- 
tance et de temps d’une extrême précision : les petits écarts qui existent aux faibles 
vitesses entre les prédictions « classiques » et les prédictions de la théorie de la 
relativité deviennent accessibles à la mesure. L'exemple le plus frappant de cette 
situation est le GPS (figure [.1) qui ne permet de mesurer les coordonnées pré- 
cises d’un point que parce qu'il utilise pour son fonctionnement les équations de 
la relativité. L'utilisation des « évidences » classiques conduirait à une erreur de 
positionnement qui dépasserait rapidement plusieurs kilomètres ! 

+ pour étudier la structure intime de la matière, les physiciens ont mis au point des 
machines, comme les synchrotrons et les anneaux de stockage, qui sont suscep- 
tibles de communiquer une vitesse proche de celle de la lumière à des électrons, 
des protons, des ions, de les faire interagir à très grande énergie et de caractériser 
avec grande précision les phénomènes qui se produisent (figures I.2 et [.3 asso- 
ciées au Large Hadron Collider (LHC), le plus grand accélérateur de particules 
au monde). La relativité est évidemment le cadre obligé pour la description de ces 
phénomènes. La première partie de cet ouvrage, consacrée à l’exposé élémentaire 
des bases de la relativité, sera ainsi l’occasion d’une incursion dans la physique 
nucléaire, la radioactivité et la physique des particules élémentaires. 





Figure 1.2 - Vue aérienne du Large Hadron Collider situé à la frontière franco-suisse : 
avec schéma des différents accélérateurs et détecteurs de particules enterrés. 
Le cercle indique l'emplacement où circulent les particules, qui est enterré à une 
profondeur de 100 m. 
(source : http://sciencesprings.wordpress.com/2014/07/10/from-bbc-lhc-scientists-to-search-for-fifth-force- 
of-nature/) 





Figure 1.3 - Événement typique, obtenu au LHC, sur lequel on a pu mettre en évidence 
la présence éphémère du mystérieux « boson de Higgs ». 
(source : CERN : https://cdsweb.cern.ch/record/1459462) 
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Le but de ce chapitre est de rappeler certains points importants de la mécanique clas- 
sique concernant les changements de référentiels. Cette problématique est en effet au 
cœur de la relativité, et l’aspect classique des notions de temps et d’espace est une 
bonne introduction pour les chapitres suivants. 


SKENcarr 1.1 La longue élaboration des concepts physiques relatifs au 
temps, à l’espace et au mouvement 


Dès l’Antiquité, les hommes se sont posés des questions sur le temps, l’espace et 
le mouvement à partir de leur expérience quotidienne. Ils constatent qu’il y a des 
mouvements extrêmement réguliers dans le ciel, et des mouvements complexes 
sur la Terre, avec l’omniprésence de la gravité et des frottements. Par exemple, 
dans le monde méditerranéen, Aristote, au IV® siècle avant J.-C., jette les bases 
d’une mécanique qualitative des mouvements terrestres dans un milieu plein et 
résistant. Il postule l’existence d’un haut et d’un bas absolu, et le fait que tout 
mouvement nécessite un « moteur » : le mouvement s’arrête lorsque son moteur 
n’agit plus. Il considère le temps comme donné a priori. 


Pour les mouvements célestes, Ptolémée, au II® siècle avant J.-C, postule que la 
Terre est immobile, et que les corps célestes tournent autour d’elle. Pour rendre 
compte des observations sur le mouvement complexe des planètes, il met au 
point le système des épicycles, qui repose sur la composition d’un très grand 
nombre de mouvements circulaires emboîtés. 


Il faut attendre la Renaissance pour que soit contestée cette vision antique du 
monde. Copernic montre en 1543 que la description du mouvement des planètes 
est extrêmement simplifiée si on met le Soleil, et non la Terre, au centre de 
l'Univers. 


Cette hypothèse hardie se heurte non seulement au dogme chrétien mais aussi 
à une objection majeure pour les esprits de l’époque : dans le système de Co- 
pernic, la Terre n’est plus immobile mais se déplace à grande vitesse. Ce mou- 
vement, nécessairement « violent » pour la mécanique aristotélicienne, devrait 
donner naissance à des phénomènes mesurables : par exemple une pierre lan- 
cée verticalement devrait partir à grande vitesse dans la direction opposée au 
mouvement de la Terre. 
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Chapitre 1 + Mécanique classique et changement de référentiel galiléen 


On voit que les problèmes de choix d’un référentiel permettant d'expliquer le 
plus simplement possible un phénomène, et de composition des vitesses lors- 
qu’on change de référentiel, sont depuis toujours au cœur des interrogations sur 
l’espace, le temps et le mouvement. 

Il revient à Galilée d’avoir fait tomber l’objection sur la non-observabilité du mou- 
vement de la Terre dans son ouvrage Dialogue sur les deux plus grands systèmes 
du monde, publié en 1632, dont nous extrayons la citation suivante, extrême- 
ment éclairante : « Enfermez-vous avec un ami dans la cabine principale à l’in- 
térieur d’un grand bateau et prenez avec vous des mouches, des papillons, et 
d’autres petits animaux volants. Prenez une grande cuve d’eau avec un pois- 
son dedans, suspendez une bouteille qui se vide goutte à goutte dans un grand 
récipient en dessous d’elle. Avec le bateau à l’arrêt, observez soigneusement 
comment les petits animaux volent à des vitesses égales vers tous les côtés 
de la cabine. Le poisson nage indifféremment dans toutes les directions, les 
gouttes tombent dans le récipient en dessous, et si vous lancez quelque chose à 
votre ami, vous n’avez pas besoin de le lancer plus fort dans une direction que 
dans une autre, les distances étant égales, et si vous sautez à pieds joints, vous 
franchissez des distances égales dans toutes les directions. Lorsque vous aurez 
observé toutes ces choses soigneusement (bien qu'il n’y ait aucun doute que 
lorsque le bateau est à l'arrêt, les choses doivent se passer ainsi), faites avan- 
cer le bateau à l’allure qui vous plaira, pour autant que la vitesse soit uniforme 
[c'est-à-dire constante] et ne fluctue pas de part et d'autre. Vous ne verrez pas 
le moindre changement dans aucun des effets mentionnés et même aucun d’eux 
ne vous permettra de dire si le bateau est en mouvement ou à l'arrêt... » 


Le mouvement, dans la mesure où il est uniforme, ne se distingue donc pas 
fondamentalement de l’état de repos et ne donne pas lieu à des phénomènes 
physiques observables. C’est un phénomène qui n’est pas violent, mais qui se 
perpétue de lui-même, sans besoin de « moteur ». 


Le mouvement de la Terre étant donc inobservable, seule subsiste alors l’op- 
position théologique à l’hypothèse héliocentrique. Celle-ci l’a temporairement 
emporté, puisque Galilée a été contraint de renoncer en 1633 à son explication. 
Fort heureusement, les conceptions de Galilée et de Copernic se sont tout de 
même imposées naturellement comme seule conception rationnelle du monde 
dans les décennies suivantes, et ont définitivement triomphé avec la publication 
par Newton, en 1684, de lois mathématiques précises qui s'inscrivent dans le 
prolongement des conceptions de Galilée et qui permettent de déterminer quan- 
titativement et avec une extrême précision le mouvement des corps terrestres 
aussi bien que célestes. 


1.1 MÉCANIQUE NEWTONIENNE ET PRINCIPE 

DE RELATIVITÉ GALILÉENNE 
Nous n’allons pas ici détailler les principes de la mécanique classique dont les bases 
ont été Jetées par Newton, mais en rappeler certains aspects qui seront importants 
dans la suite. Nous nous concentrerons en particulier sur la notion de référentiel, qui 
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1.1. Mécanique newtonienne et principe de relativité galiléenne 


est au cœur des concepts sur l’espace et le temps (encart 1.1). Plus précisément, on 
appelle référentiel À la donnée d’un repère orthonormé Oxyz de l’espace physique et 
d’une horloge H permettant de mesurer l’écoulement du temps dans ce repère. 


1.1.1 Référentiels galiléens 


Les réflexions de Galilée, exprimées de manière extrêmement imagée dans l’en- 
cart 1.1, montrent que les lois de la dynamique sont les mêmes dans différents ré- 
férentiels (le bateau à l’arrêt ou en mouvement), pourvu que le mouvement relatif 
entre ces référentiels soit uniforme. Lorsque ce n’est pas le cas, 1l apparaît des forces 
nouvelles qui modifient le mouvement des corps. Ainsi, on s’aperçoit que le bateau 
est en mouvement si son mouvement n’est plus uniforme, par exemple lorsqu'il y a 
une vague importante qui « agite » le bateau. 

On est donc conduit à postuler l’existence d’un ensemble de référentiels, appelés 
référentiels galiléens, pour lesquels est valable le principe de relativité galiléenne 
suivant : 


Il existe un ensemble de référentiels, appelés référentiels galiléens, dans lesquels 
les lois de la dynamique ont la même forme. 
Ces référentiels sont en mouvement uniforme les uns par rapport aux autres. 


Cela signifie plus précisément que les lois de la dynamique s’écrivent dans deux ré- 
férentiels galiléens R et R’ différents avec les mêmes équations, pourvu qu’on écrive 
ces équations en exprimant les positions des points matériels à l’aide de leurs coor- 
données dans le référentiel concerné et en utilisant la même variable temps. 


1.1.2 Principe fondamental de la dynamique 


Nous l’écrivons ici pour un point matériel M de masse mm : 


dVm(?) 
m _ 
dt 





F (1) 


où F est la somme vectorielle des forces s’appliquant sur ce point. 

Dans cette équation vr/(f) est la vitesse du point M à l’instant f dans le référentiel 
galiléen À dans lequel on se place. Considérons alors un autre référentiel galiléen À’, 
animé d’une vitesse constante V par rapport à À. Soient O et O’ les origines des deux 
repères associés. On a alors, d’après la relation de Chasles : 


—> —— RE 
O'M = OM - O0’ (1.2) 
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et donc en dérivant par rapport au temps : 


Vu) = vu) - V (1.3) 


La vitesse Vy@) du point dans le nouveau référentiel est la vitesse dans l’ancien 
référentiel à laquelle on retranche vectoriellement la vitesse du référentiel. On en 
déduit en dérivant une deuxième fois : 


dvy(t) : 


Ai (1.4) 


Le principe fondamental de la dynamique a donc la même forme dans deux référen- 
tiels différents, si l’on postule que l’expression des forces est la même dans les deux 
référentiels. Les mouvements déduits de cette équation seront donc les mêmes dans 
des repères galiléens différents. Leur observation ne permettra pas de distinguer un 
référentiel galiléen d’un autre. En revanche, si on se place dans un référentiel autre 
qu’un référentiel galiléen, les lois de la dynamique changent : il faut alors ajouter 
au second membre de la relation précédente d’autres forces, appelées forces d’iner- 
tie, comme la force centrifuge ou la force de Coriolis dans le cas d’un mouvement 
circulaire. Comment savoir si le référentiel dans lequel on se place est galiléen ? Pré- 
cisément par l’absence d’effets liés à la présence de forces d’inertie. La question se 
tranche donc au niveau expérimental, et de manière approchée. Par exemple la Terre 
n’est pas un référentiel galiléen : cela a été démontré expérimentalement par Foucault 
au XIX® siècle avec son fameux pendule de Foucault. On observe en effet que le plan 
dans lequel oscille tout pendule pesant tourne lentement autour de la verticale, alors 
qu'aucun couple vertical n’agit sur le pendule. Cette rotation est la manifestation de 
la force d’inertie appelée force de Coriolis due au mouvement de rotation de la Terre 
sur elle-même. En revanche les référentiels liés rigidement à l’ensemble des « étoiles 
fixes » utilisés en astronomie sont de très bonnes approximations de référentiel gali- 
léen, car on n’y a décelé jusqu’à présent aucune force d’inertie. 

Précisons qu’on peut cependant utiliser le référentiel terrestre comme un référen- 
tiel galiléen approché pour des mouvements se produisant sur des temps courts devant 
24 heures, pour lesquels la force de Coriolis a un effet négligeable. 


1.2 CHANGEMENT DE RÉFÉRENTIEL GALILÉEN 


1.2.1 Notion d'événement 


Un concept fructueux introduit par Einstein est celui d’« événement » : il s’agit d’un 
phénomène physique bien localisé à la fois dans l’espace et dans le temps. On peut 
donner comme exemple le choc de deux particules, l’explosion d’une bombe ou le 
bref flash lumineux émis par une source lumineuse de petite taille. On lui associe 
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1.2. Changement de référentiel galiléen 


dans un référentiel donné quatre nombres, l’instant f de son apparition et les trois 
coordonnées d’espace (x,y,z) de sa position M. 

On voit sur les exemples donnés qu’un événement E est quelque chose d’intrin- 
sèque, c’est-à-dire qu’on peut le définir par des effets mesurables indépendants du 
choix de référentiel. Par contre, les quatre coordonnées (f,x,y,z) qui le caractérisent 
sont définies dans un référentiel donné. Elles ne vont pas être nécessairement les 
mêmes dans différents référentiels. Il est donc important de connaître les relations 
qui lient ces quantités dans deux référentiels R et R’ différents. 


1.2.2 Transformations de Galilée 


Les transformations de Galilée sont les relations qui lient les coordonnées spatio- 
temporelles d’un événement donné dans deux référentiels galiléens différents R = 
(Oxyz, H) et R’ = (Ox’y’z’, H”), dans le cadre de la physique classique. Comme nous 
le verrons plus loin, elles ne sont qu’approchées et valables pour des vitesses faibles 
par rapport à celle de la lumière. Les transformations valables pour n’importe quelle 
vitesse relative entre les deux référentiels sont les transformations de Lorentz que 
nous énoncerons dans le chapitre 3 (Équations 3.1). 

Appelons V la vitesse du référentiel R’ par rapport à R et supposons qu’à l’ins- 
tant { = 0 les origines O et O’ des deux référentiels coïncident. La relation liant les 
coordonnées spatiales de M dans les deux référentiels est alors, d’après (1.3) : 


— — 
O'M=OM-Vt (1.5) 


Qu'en est-il du temps dans les deux référentiels ? Celui-ci est mesuré par des phéno- 
mènes physiques réguliers dont beaucoup sont de caractère mécanique : mouvement 
de la Terre, balancier de l’horloge (pendule simple), mouvement harmonique d’une 
masse tenue par un ressort. Le principe fondamental de la dynamique implique que 
ces mouvements sont identiques dans tous les référentiels galiléens lorsque les forces 
qui leur donnent naissance sont les mêmes. Il est donc légitime de postuler que le 
temps s'écoule de la même manière dans tous les référentiels galiléens. De plus, si 
on choisit de plus la même unité de temps et la même origine des temps dans les 
deux référentiels, on peut postuler l’identité des coordonnées de temps (f” = f) d’un 
événement donné dans tous les référentiels galiléens. Ici encore, cette identité des 
temps n’est valable que pour de faibles vitesses relatives entre les deux référentiels. 
Comme nous le verrons plus loin, elle cesse d’être exacte lorsque V s’approche de la 
vitesse de la lumière. 

Pour simplifier les expressions futures, il est d’usage de se placer dans la configu- 
ration géométrique suivante (figure 1.1) : les axes Ox et O’x’ des deux référentiels 
coïncident, et les deux autres restent à tout instant parallèles. Les relations reliant les 
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Figure 1.1- Référentiels galiléens en translation relative à vitesse uniforme V le long 
de leurs axes Ox. 


quatre coordonnées d’un même événement E dans les référentiels À et À’ s’écrivent 
alors simplement : 


f = 
x =x-Vt (1.6) 
ÿ =y 


 — 7 
… À 


Dans la suite, nous appellerons « transformations de Galilée >» l’ensemble des 
quatre relations non-relativistes (1.6). 

On peut considérer ces transformations sous deux angles, et nous ne nous priverons 
pas de le faire dans la suite : on peut considérer le référentiel À comme étant celui de 
l'observateur, et R’ sera alors celui d’objets physiques en mouvement, ou bien on peut 
considérer À comme le référentiel du laboratoire, où se déroulent les phénomènes, et 
R' sera alors celui d’un observateur en mouvement. 


1.2.3 Loi classique de composition des vitesses 


Si le point M se déplace au cours du temps, il a une vitesse vy, dans le référentiel 
R et une vitesse v;, dans le référentiel À’. En dérivant la relation (1.5) par rapport 
au temps (qui est le même dans les deux référentiels), on obtient la loi classique de 
composition des vitesses : 

Vu = Vu — V (1:79 
que l’on peut aussi écrire : 

Vu = VE V (1.8) 
Cette relation correspond à l’expérience quotidienne. Quand on marche dans un train, 
la vitesse par rapport au sol est la somme de la vitesse dans le train et de celle du train 
par rapport au sol : les vitesses du référentiel et du corps mobile s’additionnent. Nous 
allons voir que cette expression simple et intuitive n’est en réalité vraie que pour les 
vitesses petites devant celles de la lumière. 


12 


2015 Dunod. 


Copyright € 


© Dunod. Toute reproduction non autorisée est un délit. 


LUMIÈRE CLASSIQUE 
ET CHANGEMENT 
DE RÉFÉRENTIEL 

GALILÉEN 





La lumière joue un rôle essentiel en relativité. Il convient donc d’abord d’en rappe- 
ler les propriétés classiques essentielles. Les rappels de ce chapitre serviront aussi 
d'introduction à l’étude de ses propriétés quantiques, que nous aborderons dans le 
chapitre 10. 


SEncarr 2.1 La longue élaboration des concepts physiques relatifs à 
la lumière 


La vision constitue le principal moyen de contact entre l’homme et le milieu 
qui l'entoure, mais les phénomènes lumineux courants, comme la formation des 
images dans la vision ou l’arc-en-ciel, sont en fait extrêmement complexes. Ainsi, 
il a fallu beaucoup de temps pour dégager des idées simples sur la lumière et des 
concepts qui soient susceptibles de modélisation. La notion de rayon lumineux 
s’est dégagée dès l’Antiquité dans les mondes grec (Euclide) et chinois (Mozi), 
ainsi que les lois de la réflexion de ces rayons sur les miroirs. La compréhen- 
sion de la vision a posé beaucoup de problèmes, et a fait l’objet de nombreuses 
supputations. L'opinion dominante, sous l'influence de Pythagore et Euclide, a 
longtemps été que le rayon visuel se propageait de l’œil vers les objets regar- 
dés (qui subsiste encore dans les expressions comme « jeter un coup d'oeil » ou 
« porter son regard sur »). Il a fallu attendre AI Hazen et l’an mille pour que soit 
admise l’idée que les rayons sont émis des objets lumineux vers l’œil et forment 
une image à l’intérieur de celui-ci. Pour AI Hazen, la lumière était comme un 
« corps au bout d’une flèche ». 


Les propriétés grossissantes des lentilles ont été découvertes au Moyen-Age, ce 
qui a permis à des artisans ingénieux d'élaborer empiriquement les premiers 
instruments d'optique : lunettes de vue, puis au XVI® siècle lunettes d'approche, 
ou télescopes. Ces dernières ont été améliorées et utilisées par Galilée et enfin 
modélisées par Kepler. Au XVII® siècle, avec la découverte par Snell, puis Des- 
cartes, des lois exactes de la réfraction, se met en place ce qu’on appelle mainte- 
nant l’optique géométrique, qui permet de comprendre des phénomènes comme 
l’arc-en-ciel et d'élaborer des instruments d'optique toujours plus perfectionnés. 
D'autres phénomènes lumineux sont découverts : les interférences, la diffraction 
et la double réfraction. 


Si les phénomènes lumineux sont de mieux en mieux étudiés et caractérisés, la 
question de la nature de la lumière reste ouverte et fait l’objet de nombreuses 
spéculations. Huygens, puis au XVIII® siècle Euler, la tiennent pour l’ébranlement 
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d’un milieu continu qui se propage de proche en proche. Newton pose la ques- 
tion suivante : « Les rayons lumineux, ne sont-ce pas de fort petits corpuscules 
élancés ou poussés hors des corps lumineux? » Le prestige scientifique de New- 
ton fait que cette conception de particules de lumière se propageant dans le 
vide, avancée comme une simple hypothèse par Newton, prévaut pendant une 
longue période. Au début du XIX® siècle Young explique les interférences en 
s’appuyant sur les hypothèses suivantes : «1) Un éther luminifère, ténu et extré- 
mement élastique, infiltre l'Univers. 11) Des ondulations sont excitées dans cet 
éther chaque fois qu’un corps devient lumineux. » Quelques années plus tard 
Fresnel montre que l’hypothèse que la lumière monochromatique est une onde 
oscillant à une fréquence bien déterminée permet d'expliquer quantitativement 
aussi bien l’optique géométrique que les phénomènes d’interférences et de dif- 
fraction. La conception corpusculaire de la lumière est alors abandonnée. 


Les études menées à la même époque par de nombreux physiciens concernant 
les phénomènes électriques et magnétiques permettent de dégager progressive- 
ment une notion extrêmement importante et révolutionnaire : celle de champ, 
objet physique se manifestant en tout point de l’espace même vide. Au prix d’un 
extraordinaire effort conceptuel, Maxwell réussit à écrire les équations régissant 
l’évolution des champs électriques et magnétiques qui rendent compte de l’en- 
semble des phénomènes connus. || découvre que ses équations ont des solutions 
qui ont toutes les propriétés des hypothétiques ondes lumineuses de Young et 
Fresnel. Selon ses propres termes : « Nous pouvons difficilement éviter la conclu- 
sion que la lumière est constituée des ondulations transverses du même milieu 
qui est la cause des phénomènes électriques et magnétiques ». La conception qui 
prévaut ainsi à la fin du XIX® siècle est que la lumière est une onde des champs 
électriques et magnétiques régie par les équations de Maxwell. 


2.1 DESCRIPTION ONDULATOIRE DE LA LUMIÈRE 


2.1.1 Caractéristiques de l’onde lumineuse 


Considérons un rayon de lumière monochromatique se propageant dans le vide. Dans 
l’approche ondulatoire, il est décrit en tout point M d’un référentiel R par une quan- 
tité oscillante, que nous appellerons À,, et qui s’écrit donc en tout point r et à tout 
instant f : 

A,(r,f) = Aocos(wt —-k:-r) (2.1) 


où Kk est le vecteur d’onde et w la pulsation de l’onde considérée, qui sont liés à la 
longueur d’onde 1, à la période T et à la fréquence y de l’onde par : 


_ 27 _ 27 (nn) 


À = — 
k D  % 


(2.2) 


où k=|k|. Pulsation et vecteur d’onde sont liés par la relation, dite de dispersion : 


wo = ck (2.3) 
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2.1. Description ondulatoire de la lumière 


où c est une constante, homogène à une vitesse, qui vaut précisément : 
c = 299 792458 m.s | = 3 x 10° m.s"! 


Pour simplifier les calculs trigonométriques, nous utiliserons une description de 
l’onde par un nombre complexe, dont la partie réelle est l’onde lumineuse : 


A;,(r,1) = Re(A(r,n) ;  Alr,f) = Aoexp(—-i(wt -k:r)) (2.4) 


Lorsque le temps s’écoule, l’onde se propage dans la direction du vecteur K. La vi- 
tesse de propagation de la phase de cette onde (par exemple la vitesse de propagation 
de ses maxima) est donnée par : 


Up= — =C (2.5) 


Pour une onde lumineuse monochromatique jaune, par exemple, À est proche de 
0,6um = 6 X 1077 m,T de 2 fs = 2 x 1071 $ et y de 500 THz = 5 x 10/* Hz. 
Il s’agit donc d’une onde se propageant à une vitesse extrêmement grande, largement 
supérieure aux vitesses habituelles des objets naturels terrestres, et d’une oscillation 
extrêmement rapide. 

Les effets observables liés à cette onde sont proportionnels à son intensité T, égale 
au carré du module de l’amplitude complexe de l’onde : 


I(r,9) = IA, Ÿ (2.6) 


En particulier, l’énergie transportée par unité de temps et de surface par la lumière 
est proportionnelle à cette quantité. 

Quelle est la signification physique de la quantité A(r;t) figurant dans (2.1) 
et (2.6) ? Dans l’approche de Young et Fresnel, c’est la valeur instantanée de l’os- 
cillation de l’éther luminifère, sans qu’il soit besoin de préciser plus la nature de 
cette oscillation. Nous verrons dans la partie quantique de cet ouvrage que Schrüdin- 
ger a introduit de manière analogue une « fonction d’onde » ÿ(r,f) pour décrire une 
particule quantique sans bien savoir exactement ce que représentait cette fonction. 
Cela n’a empêché ni Fresnel ni Schrüdinger de manipuler ces ondes hypothétiques et 
d’en déduire des prédictions conformes à l’expérience. Maxwell a montré qu’en fait 
A(r,f) était de nature électromagnétique. Plus précisément, l’oscillation lumineuse 
peut être assimilée au champ électrique de l’onde électromagnétique. 


2.1.2 Équation d’onde, principe de superposition 


Il est facile de voir que toute onde A(x,y,z,f) de la forme (2.1), quelles que soient son 
amplitude, sa pulsation et sa direction de propagation obéit à l’équation aux dérivées 
partielles suivante : 

d'A A A 1 07A 

— + — + ——— =0 21 
ôx2 Oy? 072 c? 0 ou. 
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Il s’agit d’une équation linéaire en À. Il en résulte une propriété extrêmement 
importante des ondes, appelée principe de superposition, et que nous retrouverons 
pour la fonction d’onde quantique : 


Toute combinaison linéaire de deux ondes est encore une onde possible pour 
le système, c’est-à-dire une solution de l’équation d’onde. 


Considérons alors la somme de deux ondes de même amplitude se propageant 
dans la même direction Oz, mais présentant une différence de phase 6. Elle a pour 
expression : 


A(r,f) = Aoexp(—-i(wt — kz)) + Ao exp(—i(wt — kz + @)) 


= 2A9 exp (-i (ur — Kkz + ) COS ? (2.8) 
2 2 
et son intensité vaut : 
I(r) = |A(r, HF = 4A5 cos” : (2.9) 


L’intensité de l’onde somme est donc maximale si & est nul ou multiple de 2x, c’est- 
à-dire lorsque les deux ondes sont en phase, et nulle si & = x à 2x près, c’est-à-dire 
lorsque les deux ondes sont en opposition de phase. Dans cette dernière configura- 
tion les deux ondes sont strictement opposées en chaque point et à tout instant, on 
est amené à conclure que « de la lumière ajoutée à de la lumière donne de l’obs- 
curité », ce qui est conforme aux observations expérimentales dans les phénomènes 
d’interférence, mais n’est évidemment pas concevable dans le cadre d’une théorie 
classique corpusculaire de la lumière. Lorsqu'on fait varier la valeur du déphasage 
®, on observe une variation sinusoïdale de l’intensité mesurée, qu’on appelle franges 
d’interférence. 


2.2 LUMIÈRE ET CHANGEMENT DE RÉFÉRENTIEL 


2.2.1 Changement de référentiel pour une onde plane : effet 
Doppler non relativiste 


Comme dans le chapitre précédent sur la dynamique, nous voulons savoir comment 
un phénomène lumineux donné apparaît quand on l’observe dans des référentiels dif- 
férents. Du point de vue ondulatoire classique, on considère l’onde lumineuse comme 
la vibration d’un milieu physique, l’« éther luminifère ». La valeur locale et instanta- 
née de l’onde lumineuse est alors définie dans le référentiel privilégié Ro dans lequel 
ce milieu est au repos. On peut supposer que ce référentiel est galiléen. 

Considérons alors la même onde dans un référentiel galiléen À’ en mouvement 
uniforme de vitesse V dans la direction Ox par rapport au référentiel Ro de l’éther 
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luminifère. Elle va y être caractérisée par une pulsation w’ et un vecteur d’onde k”’ 
a priori différents. Comme il s’agit de la même oscillation, on a : 


Ao exp(—i(wt —k:-r)) = A, exp((-iw't —kK’:r°)) (2.10) 


Appelons KR, ke les coordonnées du vecteur k’ dans le référentiel R’ et Kk,,k,,,k, les 
coordonnées de k dans le référentiel RQ et utilisons la transformation de Galilée (1.6). 
On a alors : 


Ao exp(—i(ot — kxx — kyy — k:z)) = AG exp(—iw't - k(x - VD —kKy-kz)) (2.11 


Cette relation devant être vérifiée pour tout point et tout temps, on en déduit les 
transformations de Galilée pour les caractéristiques d’une onde plane : 


A6= 40 w'=w-kV kK=k k,=k, kK=k (2:12) 


Si on introduit le vecteur vitesse V, aligné selon Ox, du référentiel R’ par rapport à 
Ro, on a les relations vectorielles suivantes : 


o' =w-k-V ; K'=k (2.13) 


Il y a donc changement de pulsation, ou de fréquence, pour l’onde vue dans les 
deux référentiels. C’est le phénomène d’effet Doppler non relativiste, bien connu 
pour les ondes sonores : le son perçu par un observateur mobile n’a pas la même 
hauteur quand celui-ci se rapproche de l’émetteur sonore ou s’en éloigne. 

Il n’y a en revanche pas de changement de vecteur d’onde : la longueur d’onde et 
les plans d’onde, c’est-à-dire les plans de phase constante, restent les mêmes dans les 
deux référentiels. Mentionnons que les deux propriétés précédentes impliquent que 
la vitesse de phase de l’onde, donnée en valeur absolue par w/k n’est pas la même 
dans les deux référentiels. Nous verrons au chapitre suivant que cette conséquence 
des transformations de Galilée n’est pas conforme à l’expérience. 


2.2.2 Changement de référentiel pour un faisceau lumineux 
limité : aberration classique 


Le paragraphe précédent a traité le cas de l’onde plane, qui est un cas simple, mais 
éloigné de la réalité, car il entraîne que l’onde a la même intensité en tout point de 
l’espace, et donc que son énergie totale, intégrée sur tout l’espace, est infinie. Plus 
proche de la réalité est une onde dont l’intensité est limitée dans le temps et dans 
l’espace. Considérons le « paquet d’ondes » suivant : 


A(x,y,2,t) = Ao exp(—i(ot — Kkz)) fo(x,y,t — z/c) (2.14) 
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J0(x,0,0) 








Figure 2.1- (a) Forme spatiale du « paquet d'ondes lumineuses »; (b) Propagation de ce 
paquet d'ondes localisé le long de l’axe Ox vue dans les référentiels R et À’. La largeur 
de la flèche, égale à A, donne l'extension latérale du faisceau lumineux. 


où f, est une fonction en forme de « bosse » à la fois spatiale et temporelle, prenant 
sa valeur maximale pour la valeur 0 de toutes ses variables, de largeur spatiale A et de 
largeur temporelle Ar (figure 2.1). Il s’agit d’un paquet d’onde localisé spatialement 
le long de l’axe OZ ayant la forme d’une brève impulsion temporelle se propageant 
le long de cet axe à la vitesse c. On montre que c’est aussi une solution de l’équation 
d'onde (2.7), pourvu que son extension spatiale en x et y soit suffisamment grande 
par rapport à la longueur d’onde pour qu’on puisse négliger les phénomènes de dif- 
fraction. L'extension temporelle peut être en revanche quelconque. 

Vu dans le référentiel À’, en translation uniforme selon Ox par rapport à À, le 
même paquet d’onde a pour expression, en utilisant (1.6) : 


A(x,y,2°,1) = Ao exp(—-i(t” — kz'))fo(x + VE',y,1 — z'Jc) (2.15) 


Il s’agit d’un paquet d’ondes centré maintenant en x’ = —V#',y = 0,1 = z//c. En 
éliminant le temps entre ces relations, on voit que le maximum d'intensité du paquet 
se déplace sur la droite d’équation x’ = —(V/c)z’ ,y" = 0, et non plus x = 0,y = 0. 
Il en résulte que La direction de propagation du faisceau lumineux change quand 
l'observateur se déplace par rapport à l’onde. Y s’agit du phénomène d’aberration 
classique. Plus précisément, l’angle d’aberration par rapport à la direction de propa- 
gation initiale Oz est donné par tan # = —(V/c). Précisons que le terme oscillant est 
toujours de la forme cos(wt” — kz'), c’est-à-dire que les surfaces de phase constante 
sont des plans perpendiculaires à O’z’, donc non orthogonaux à la direction de pro- 
pagation de l’impulsion. 
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Figure 2.2 - Propagation d’une particule se déplaçant le long de Ox vue dans les 
référentiels R et #’. 


Ce phénomène a été découvert en 1725 par l’astronome Bradley, qui avait constaté 
que les étoiles qu’il observait dans son télescope n’avaient pas une position fixe sur le 
long terme, mais décrivaient en un an un petit cercle sur la voûte céleste. Ce « mou- 
vement apparent » est une manifestation de l’aberration. Il est dû au fait que la Terre 
est en mouvement autour du Soleil, et donc que l’angle d’aberration de la lumière 
venant des étoiles change au cours de l’année. 


2.2.3 Changement de référentiel pour une particule 
classique : loi classique de composition des vitesses 


Plaçons-nous un moment dans l’hypothèse de Newton pour la lumière, formée de 
corpuscules se propageant avec la vitesse vectorielle € dans le référentiel À. Consi- 
dérons le même cas que dans le paragraphe précédent d’un faisceau se propageant 
le long de l’axe OZ (figure 2.2). La position r d’un de ces corpuscules dans le réfé- 
rentiel R est alors donnée par (x = 0; y = 0,z = ct), et dans le référentiel À’ par 
CE = Vr = 0 s'y. 

La vitesse du corpuscule dans ce référentiel a donc pour coordonnées : (c = 
Vic, = 0;c = c). On peut finalement écrire pour les vitesses vectorielles c et 
c’ des corpuscules de lumière dans les deux référentiels : 


c=c-V (2.16) 


C’est la loi vectorielle classique de composition des vitesses, qui conduit, pour trou- 
ver la vitesse dans le nouveau référentiel, à retrancher la vitesse du référentiel à celle 
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du mobile dans le référentiel initial. Remarquons que la direction de propagation de 
la lumière dans le nouveau référentiel est la même que dans l’approche ondulatoire 
du paragraphe précédent : on retrouve le phénomène d’aberration, mais expliqué dif- 
féremment. Si on remplace les corpuscules de lumière par des gouttes de pluie, 1l n’y 
a rien d’étonnant à ce que la direction apparente de la pluie ne soit pas la même si on 
est immobile ou si on est en mouvement par rapport à celle-ci. 

Comme dans le cas de l’approche ondulatoire, la question de l’existence d’un ré- 
férentiel privilégié se pose : les corpuscules de lumière vont-ils à la vitesse c unique- 
ment dans un référentiel galiléen unique Ro, comme c’est le cas d’une particule se 
déplaçant dans un milieu visqueux, ou vont-ils à la vitesse c dans le référentiel lié la 
source lumineuse ? Dans cette deuxième éventualité, la vitesse de la lumière émise 
par un corps en mouvement devrait être la somme de la vitesse de la lumière et de 
la vitesse du mobile, comme pour une balle lancée par une personne en mouvement. 
Dans le cas d’un système d’étoiles doubles en rotation l’une autour de l’autre, la 
vitesse de la lumière émise par les deux étoiles ayant des vitesses différentes ne de- 
vrait pas être la même et la lumière issue de l’étoile se rapprochant de nous pourrait 
alors arriver plus vite que celle issue de l’étoile s’éloignant de nous, ce qui n’est pas 
conforme aux observations astronomiques, qui semblent donc impliquer l’existence 
de ce référentiel privilégié Ro. 


2.2.4 Changement de référentiel pour des champs 
électrique et magnétique 


Nous savons depuis Maxwell que la lumière est une onde électromagnétique, et 1l 
est donc important de savoir comment les champs E et B se comportent dans un 
changement de référentiel. L’invariance galiléenne requiert que les effets observables 
de ces champs, c’est-à-dire les forces électromagnétiques, soient les mêmes dans tout 
référentiel galiléen. La force en question pour une charge ponctuelle g de vitesse v 
étant la force de Lorentz q(E + v X B), on a alors : 


qgŒE' + v’ x B') = q(E + v x B) = g(E + (v’ + V) x B) (2.17) 


en utilisant la loi (2.16) v’ = v — V de composition des vitesses pour un corpuscule. 
On en déduit la transformation de Galilée des champs : 


B'-B ; E’-E+VXxB (2.18) 


Y a-t-il invariance galiléenne des équations de Maxwell, en tenant compte de la 
transformation (2.18) des champs ? L’encart 2.2 montre sur un exemple particulier 
que ce n’est pas le cas. Les phénomènes électromagnétiques peuvent donc être diffé- 
rents dans deux repères galiléens différents. On est par conséquent amené à conclure, 
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si l’on tient à conserver l’expression galiléenne (1.6) de la formule de changement 
de référentiel, qu’il existe un référentiel privilégié Ro dans lequel sont valables les 
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équations de Maxwell. 


NEÿcarr 2.2 Un dispositif électromagnétique où la force dépend du 


référentiel 


Considérons le dispositif de la figure 2.3 : il se compose d’une charge ponctuelle 
Q de charge électrique Q à une distance d d’un fil F porteur de charges statiques 
uniformément réparties. On appelle à la charge par unité de longueur portée par 
ce fil. 


a) 


b) 


Calculons d’abord la force F exercée sur Q dans le référentiel À, supposé gali- 
léen, où charges et fils sont au repos. il s’agit d’un problème d’électrostatique 
classique. La force est radiale et son module a pour expression : 


__«Q 
à 2r£0d 





(2.19) 


Considérons maintenant le même dispositif dans le référentiel galiléen &'’ 
animé d’une vitesse constante V parallèle au fil. Les charges liées au fil F 
sont maintenant en mouvement, ce qui donne naissance à un courant / = -«V, 
donc à un champ magnétique tangentiel dont le module vaut, au niveau de Q : 


aol 
B= 5 (2.20) 
La charge Q est animée dans le nouveau référentiel d’une vitesse -V et elle est 
donc sensible au champ magnétique. La force de Lorentz totale qui s'exerce 
sur Q est la somme d’une force électrostatique dont l'expression est la même 
dans les deux référentiels, et d’une force magnétique QVXB elle aussi radiale. 
Son module vaut donc : 


r_ _2Q 


F' = — QVB = F(1 - souo V?) (2.21) 
2re0d 





La force n’a pas la même valeur dans les deux référentiels, donc les mou- 
vements provoqués par cette force ne seront pas les mêmes : les lois des 
phénomènes électriques et magnétiques ne sont pas les mêmes dans deux 
référentiels galiléens, ce qui est contraire au principe de relativité galiléenne. 


oQ 

I 

| d 

| F 


000000000000. 


Figure 2.3 - Charge ponctuelle Q placée à une distance d d’un fil uniformément 
chargé. 
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La théorie de Maxwell montre que la vitesse de propagation c des ondes élec- 
tromagnétiques (et donc de la lumière) est donnée par c = (souo) /2. La varia- 
tion relative de la force que nous venons de trouver est donc en (1 — V2/c?), 
quantité très proche de 1 vu la valeur extrêmement élevée de c, mais non 
nulle et donc en principe mesurable. 


2.3 MESURES DE LA VITESSE DE LA LUMIÈRE 


Il semble donc qu’il existe une différence majeure entre les phénomènes dynamiques, 
qui obéissent au principe de relativité galiléenne, et les phénomènes lumineux et plus 
généralement électromagnétiques, qui semblent impliquer l’existence d’un référen- 
tiel absolu Ro qui est en quelque sorte le siège des oscillations des champs électriques 
et magnétiques. Les ondes lumineuses se comportent apparemment comme les ondes 
sonores : ces dernières consistant en des vibrations d’un milieu matériel, gazeux ou 
solide, le référentiel Ro dans lequel ce milieu est au repos joue un rôle privilégié. Si 
on se place dans un référentiel galiléen À autre que Ro, la vitesse de l’onde mesu- 
rée dans ce référentiel ne sera plus la même que dans Ro, et surtout elle ne sera pas 
isotrope et dépendra des orientations relatives du vecteur d’onde k de l’onde et de la 
vitesse V du référentiel À par rapport à Ro. 

Comme toujours en physique, c’est à l'expérience de trancher : la mesure de la 
vitesse de propagation c de la lumière, et surtout l’évaluation de son éventuelle ani- 
sotropie, sont donc essentielles dans ce contexte. 


2.3.1 Les premières mesures de la vitesse de la lumière 


Mesurer la vitesse de la lumière n’est pas simple en raison de l’extrême rapidité 
de cette propagation. La première tentative connue en Occident a été réalisée par 
Galilée vers 1600, qui disposa deux opérateurs munis de lanternes sur deux collines 
éloignées. Le premier dévoile sa lanterne à un instant f1, le second dévoile la sienne 
dès qu’il commence à voir la lumière de la première lanterne. Le premier note alors 
le temps f auquel il commence à voir la lumière de la deuxième lanterne. Ce type 
d’expérience réalisée avec des sources sonores permet de mesurer aisément la vitesse 
de propagation du son dans l’air. En ce qui concerne la lumière, l’absence de retard 
ft — t1 mesurable constaté par Galilée lui permettait de conclure que la lumière avait 
une propagation « extrêmement rapide ». 

C’est à l’astronome O. Rômer que revient le mérite d’avoir fait, en 1676, la pre- 
mière évaluation quantitative de cette vitesse. Les astronomes de l’Observatoire de 
Paris avaient observé sur de très longues périodes la position du satellite de Jupiter 
appelé lo, et en particulier, grâce aux horloges perfectionnées dont ils disposaient, 
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noté avec précision les instants #, d’occultation de Io par Jupiter, séparés d’environ 
42 heures. II s’avérait que ces instants n’étaient pas strictement périodiques comme le 
prédit la mécanique classique : on observait plus précisément des instants #, donnés 
par : 

In =NT +ôy (2.22) 


avec T = 42,34 heures et 6, oscillant autour de zéro avec une amplitude de +8 mi- 
nutes sur une année terrestre. Rômer attribua cette variation à la vitesse finie de propa- 
gation de la lumière depuis Jupiter jusqu’à l’observateur terrestre (figure 2.4). Appe- 
lons À le rayon de l’orbite de Jupiter et R7 le rayon de l’orbite terrestre. Au moment 
de l’année où la Terre est au plus près de Jupiter (point Ti), l'événement (au sens 
du paragraphe 1.2.1) « nièM® occultation de Io par Jupiter » se produit à la distance 
Rj — Rr de la terre. Six mois plus tard (point T3), l'événement « n'ème occultation de 
lo par Jupiter » se produit à la distance R;+R7 (Jupiter ne bouge pratiquement pas sur 
une année terrestre, sa période de révolution étant de 11,9 ans). Si T est la période de 
révolution de Io autour de Jupiter, on a donc pour les instants d’occultation mesurés 
par un observateur terrestre : 

LL =nt 


j 4,0 


" —— (2.23) 


Ry + Rr 
EE, 
c : 


€ 


où n°-n est de l’ordre de 100. L'écart maximal par rapport à l’exacte périodicité, c’est- 
à-dire les 16 minutes mesurées par les astronomes, est donc de 2R7/c, temps de pro- 
pagation de la lumière sur le diamètre terrestre. Cette observation permet donc de dé- 
terminer la vitesse c de la lumière si l’on connait le rayon de l’orbite terrestre. Rômer 
en déduisit pour la vitesse de la lumière : c = 215 000 km.s”!. En 1694, Halley, dis- 
posant d’une mesure plus précise de Rr = 1,5 x 108 m, trouva c + 295 000 km.s”!, à 
quelques % de la valeur exacte. 

L'amélioration des techniques expérimentales au XIX® siècle permit aux physi- 
ciens À. Fizeau et L. Foucault vers 1850 d’effectuer des mesures de cette vitesse 
sur des distances de propagation beaucoup plus courtes (de l’ordre de quelques kilo- 
mètres), de confirmer et d’affiner cette valeur avec une précision de l’ordre du %. 


2.3.2 Quelques ordres de grandeur 


La lumière se propage donc à une vitesse proche de 300000 km.s”-! qui est large- 
ment supérieure à celle de tous les mobiles terrestres : un sprinter a une vitesse de 
0,01 km.s-!, un TGV 0,1 km.s_!, un avion de chasse 1 km.s”!, un satellite artifi- 
ciel 10 km.s_! environ. Les objets astronomiques se déplacent aussi très lentement 
par rapport à la lumière : 30 km.s_! pour la Terre autour du soleil, 250 km.s”! pour 
le Soleil autour du centre galactique, soit un rapport v/c n’excédant pas 10°. Seuls 
des objets microscopiques comme les particules élémentaires et les ions atteignent 
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Figure 2.4- Schéma du système solaire montrant le satellite lo tournant autour de 
Jupiter et les orbites de Jupiter et de la Terre autour du soleil. 


des vitesses proches de la lumière dans les accélérateurs de particules et anneaux de 
stockage, ou des objets astronomiques extrêmement éloignés comme les quasars. 

On peut donc légitimement penser que la vitesse de la Terre par rapport à l’hypo- 
thétique référentiel siège des oscillations lumineuses Ro est au maximum de l’ordre 
de un millième de la vitesse de la lumière. Si on veut mettre en évidence le mou- 
vement de la Terre par rapport à ce référentiel, il faudra donc effectuer des mesures 
de l’anisotropie de c d’une très grande précision. C’est A. Michelson qui le premier, 
en 1881, eut l’idée d'utiliser les techniques interférométriques de l’optique, qui sont 
extrêmement sensibles, pour effectuer cette mesure d’anisotropie. 


2.3.3 Interféromètre de Michelson 


Description. L’interféromètre imaginé par Michelson est schématisé sur la figure 
2.5. Son élément central est constitué par une lame semi-réfléchissante (L), qui a la 
propriété de réfléchir et transmettre simultanément la lumière avec des coefficients de 
réflexion et de transmission égaux. Concrètement, il s’agit d’une lame de verre dont 
une face a subi un traitement anti-réfléchissant et l’autre face a subi un traitement 
approprié pour que les puissances des faisceaux réfléchis et transmis soient égales 
chacune à la moitié de la puissance incidente. 
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Figure 2.5 - Interféromètre de Michelson immobile dans &, : A est la source lumineuse, 
(L) une lame semi-réfléchissante, B et C deux miroirs plans et D un détecteur de lumière. 


Le dispositif est éclairé selon la direction (AL) par un faisceau de lumière mono- 
chromatique de longueur d’onde À et de période T = 4/c. Celui-ci est divisé par la 
lame (L) en deux faisceaux (LB) et (LC) qui se propagent selon des directions ortho- 
gonales. Deux miroirs placés en B et C perpendiculairement aux directions de pro- 
pagation réfléchissent sur eux-mêmes ces faisceaux, qui viennent se recombiner au 
même point L de la lame semi-réfléchissante. Un photodétecteur placé sur le faisceau 
de sortie (LD) en mesure l’intensité. Ce faisceau est la superposition des faisceaux 
ayant effectué les trajets (ALBL) et (ALCL). Nous avons vu que deux ondes mono- 
chromatiques se propageant dans la même direction, d’amplitudes complexes respec- 
tives Ao exp(—i(wt — Kz)) et Ag exp(—i(wt — Kz + @)), pouvaient interférer constructi- 
vement ou destructivement selon la valeur de la différence Ÿ entre leurs phases d’os- 
cillation (section 2.1.2), et qu’on avait : 


29 (2.24) 


I(r) = 2A° cos 
Ainsi, si les longueurs parcourues par les deux ondes (ou les temps de parcours) sont 
identiques, les ondes sont en phase (9 = 0) et l'intensité mesurée est maximale. En re- 
vanche, si les longueurs des deux trajets diffèrent d’une demi-longueur d’onde (ou les 
temps de parcours d’une demi-période), les deux ondes sont en opposition de phase 
( = x). L’interférence est totalement destructive et l'intensité mesurée est nulle. 
Si on se rappelle que la période optique est de l’ordre de quelques femtosecondes 


25 


15 Dunod, 


O 201 


Chapitre 2 - Lumière classique et changement de référentiel galiléen 


26 





Figure 2.6- Interféromètre de Michelson en mouvement dans % : les lettres avec 
« prime » indiquent la position de la lame et des miroirs au moment où la lumière arrive 
sur le miroir supérieur; les lettres avec « seconde » indiquent la position de la lame et 
des miroirs au moment où la lumière arrive sur la lame semi-réfléchissante. 


(1075 $s) on voit que le dispositif permet d’apprécier des différences de temps de 
propagation extraordinairement ténues entre les deux trajets effectués par la lumière. 

Cas d’un interféromètre en mouvement Considérons un interféromètre dans le- 
quel les distances LB et LC sont exactement égales à £. Si le référentiel dans lequel 
l’interféromètre est immobile est le référentiel Ro où les équations de Maxwell sont 
valables, la vitesse de propagation de la lumière y est isotrope, et les temps de par- 
cours des deux faisceaux sont identiques : il y a interférence constructive et l’intensité 
mesurée en D est maximale. 

Considérons maintenant le cas où l’interféromètre est animé d’une vitesse V le 
long de (AC) par rapport à Ro (figure 2.6). Pendant un temps f, tous les points de 
l’interféromètre se déplacent donc de Vf parallèlement à (AC). Calculons dans ce 
référentiel les temps de parcours f3 et fc des deux faisceaux entre leurs deux passages 
sur la lame semi-réfléchissante L : 

e Pour le trajet (LBL), les faisceaux perpendiculaires au mouvement vont subir le 
phénomène d’aberration (section 2.2.2) et se propager obliquement dans Ro de fa- 
çon à atteindre toujours le même point B du miroir. Soit f, le temps de propagation 
de L à B. Le point B se déplace de Vf;, pendant la propagation et on a donc : 


L f, 5 2 
f\ = : 4 VAT (2.25) 


D'où ti, = {/ Ve? — V'ettg = 2h = 24] Ve? — V2. 
e Pendant le temps # du trajet (LC), le miroir € se déplace de Vh, et on a donc 
1 = (£+Vi)/c. De même, pendant le temps 7: du trajet (CL), la lame L se déplace 
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de V#, et on a donc f3 = (£ — Vf:)/c. Le temps de parcours total vaut alors : 








Il 1 c 
IC=t+ts=t + = 26— 2.26 
TT 5 v) c? — V? Sos, 


Finalement, la différence des temps de propagation vaut, à l’ordre le plus bas 
en V/c: 


£ V? 
1c — 18 = > (2.27) 
CC 
et le déphasage entre les deux ondes vaut : 
Cm PP AE (2.28) 
ÿ = 2x T = mo x 


Pour un interféromètre de dimension £ = 1 m ce déphasage vaut x pour une lumière 
jaune et V/c = 107*. Il y a donc annulation totale de l’intensité mesurée si l’interfé- 
romètre se déplace à la vitesse de 300 km.s_! par rapport au référentiel Ro. En fait, 
on est capable d’apprécier des variations d’intensité bien plus petites que le passage 
à l’extinction totale, et donc des différences de phase bien inférieures à x. Le dispo- 
sitif imaginé par Michelson est donc remarquablement sensible au « vent d’éther », 
comme on disait au XIX® siècle, c’est-à-dire au mouvement de l’interféromètre par 
rapport au référentiel Ro de l’éther luminifère. 


2.3.4 Résultats expérimentaux 


S1 l’on fait tourner l’interféromètre dans son plan, on échange tous les 90° les rôles 
des bras (LBL) et (LCL), et la différence des temps de propagation, donc la phase 
entre les deux ondes qui interfèrent, doit changer au cours de la rotation. Une pre- 
mière expérience, réalisée en 1881, ne permit pas de voir de variation du signal in- 
terférentiel en fonction de cette rotation. Une deuxième expérience, réalisée en 1887 
en collaboration avec Morley et utilisant un interféromètre plus grand (£ = 10 m), 
donna aussi, malgré sa grande sensibilité et le soin extrême apporté à l’expérience, 
un résultat négatif, ce qui excluait des vitesses V supérieures à quelques km.s”!. 
Depuis cette expérience fondatrice, de nombreux physiciens se sont attachés à uti- 
liser les progrès technologiques pour améliorer la sensibilité à la vitesse V de leurs 
dispositifs expérimentaux. L'utilisation de lasers susceptibles de produire de la lu- 
mière extrêmement monochromatique et très stable en intensité a permis, à partir des 
années 1960, d’augmenter par un facteur important la sensibilité des expériences à 
une éventuelle anisotropie de la vitesse de la lumière. Toutes, jusqu’à aujourd’hui, se 
sont soldées par un résultat négatif : aux erreurs (très faibles) d’expérience près, la 
vitesse de la lumière ne dépend pas du référentiel galiléen dans lequel on la mesure. 


27 


Chapitre 2 - Lumière classique et changement de référentiel galiléen 


28 


L’encart 2.3 décrit brièvement deux de ces expériences. 


SEÿcarr 2.3 Mesures récentes de l’anisotropie de la vitesse de la 


1. 


lumière 
Décrivons d’abord l'expérience réalisée en 1979 par A. Brillet et J. Hall 
(Physical Review Letters vol 42, p. 549), une des premières à utiliser un 
laser pour ce type de mesure. 
Un laser est constitué par une « cavité Fabry-Perot », c’est-à-dire par deux 
miroirs distants de Let se faisant exactement face, à l’intérieur de laquelle 
on a disposé un dispositif amplificateur de lumière. Comme pour le son 
émis par un tuyau d’orgue ou une corde de guitare, l'onde lumineuse émise 
par le laser est une onde résonnante pour la cavité Fabry-Perot : elle se 
renforce à chaque aller-retour, parce qu’elle se retrouve en phase avec 
elle-même lorsqu'elle a effectué un aller-retour entre les deux miroirs. Cela 
implique que le temps de son aller-retour dans la cavité est un multiple de 
la période T = 1/» d'oscillation de l’onde : 

2UC= PT =p} (2.29) 
où p est un entier et L la distance entre les miroirs. La fréquence de la 
lumière émise par un laser dépend donc de la vitesse de la lumière dans le 
référentiel où le laser est au repos. 
L'expérience de Brillet et Hall a consisté à comparer les fréquences émises 
par deux lasers de même longueur, l’un fixe et l’autre pouvant tourner 
dans un plan horizontal (figure 2.7). L’éventuelle variation de la vitesse 
de la lumière en fonction de la direction, Ac, c’est-à-dire son anisotropie, 
induit une différence entre les fréquences des deux lasers, que l’on peut 
détecter avec une sensibilité extrême en mesurant le battement entre les 
deux ondes. Des mesures répétées de la fréquence de ce battement abou- 
tirent à une détermination de la variation de la vitesse de la lumière telle 
que : Acc =(1,5+2,5)x10"1$ donc compatible avec zéro avec une précision 
relative de 10-!$, ce qui constituait un test de l’isotropie de c 4 000 fois 
plus précis que les mesures précédentes 





Figure 2.7 - Schéma du dispositif expérimental de comparaison des 
fréquences d’un laser fixe et d’un laser tournant. 
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2. La mesure a été améliorée d’un facteur 100 en 2010 par C. Eisele, A. 
Nevsky et S. Schiller (Physical Review Letters vol.103, p. 090401), qui ont 
utilisé le dispositif de la figure 2.8 : il s’agit de quatre miroirs de très 
grande réflectivité se faisant face deux à deux, constituant deux cavi- 
tés Fabry-Perot orthogonales. Il existe des techniques dites d’asservisse- 
ment, qui permettent de forcer un laser à osciller à une fréquence égale 
à la fréquence de résonance d’une cavité Fabry-Perot, donnée par l’équa- 
tion (2.29) où L est maintenant la longueur de la cavité Fabry-Perot de ré- 
férence (sans milieu amplificateur à l’intérieur) et non pas celle de la cavité 
Fabry-Perot du laser. 





Figure 2.8- Double cavité en verre à faible coefficient de dilatation dont on 
compare les fréquences de résonance. 


Dans l’expérience, deux lasers extrêmement monochromatiques sont asservis 
chacun sur une des deux cavités Fabry-Perot. La mesure de la différence des fré- 
quences entre les deux lasers permet de remonter à la différence des vitesses 
de propagation dans deux directions orthogonales. La variation de cette diffé- 
rence lorsqu'on fait tourner le dispositif est une mesure de l’anisotropie de c. La 
très grande rigidité du dispositif et les progrès dans les techniques optiques ont 
permis de mesurer une variation relative de vitesse de la lumière entre les deux 
cavités inférieure à 1077, correspondant à une vitesse V de déplacement nulle 
avec une précision de 10 micromètres par heure! 
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RESTREINTE 
TRANSFORMATIONS 
DE LORENTZ 


Les problèmes soulevés par l’existence hypothétique d’un référentiel absolu Ro pour 
l’électromagnétisme et, en particulier, l’expérience de Michelson, mirent en évidence 
une inconsistance majeure dans les conceptions théoriques de la fin du XIX® siècle, 
plus précisément entre les équations de l’électromagnétisme (les équations de Max- 
well) et les équations classiques de changement de référentiel (transformations de 
Galilée, loi de composition des vitesses) qui pourtant fonctionnent si bien lorsqu’on 
les applique à la mécanique. Une « révolution scientifique », au sens donné à ce terme 
dans l’introduction, était donc nécessaire pour sortir de l’impasse. De nombreux phy- 
siciens se sont attelés à cette tâche autour des années 1900. II revient à Albert Einstein 
d’avoir eu le premier, en 1905, l’audace, l’intuition physique et la profondeur d’ana- 
lyse nécessaires pour mener jusqu’au bout cette révolution, baptisée « théorie de la 
relativité restreinte ». C’est ce qu’il fit dans un article publié dans la revue « Zeit- 
schrift für Physik » | et intitulé « Sur l’électrodynamique des corps en mouvement » : 
pour résoudre l’inconsistance, il proposa de conserver les lois de l’électrodynamique 
et de modifier les transformations de Galilée, c’est-à-dire nos conceptions de l’espace 
et du temps. 

Dans le paragraphe suivant, nous énoncerons les principes de base qu’il a proposés, 
et en déroulerons ensuite les conséquences. 


3.1 PRINCIPE DE RELATIVITÉ RESTREINTE 


Comme toujours en physique, les principes de base ne peuvent pas se démontrer. Ils 
sont posés a priori et leur validité est fondée sur la conformité de leurs conséquences 
avec les observations expérimentales. Remarquons aussi que les nouveaux principes 
doivent être compatibles avec la physique classique, c’est-à-dire redonner les lois 
de la physique classique et le principe de relativité galiléenne pour des vitesses de 
déplacement faibles par rapport à la vitesse de la lumière. 


1. On trouvera sa traduction en français dans l’ouvrage : Albert Einstein, œuvres choisies, t 2, p. 31-58, 
Editions du Seuil. 
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3.1.1 Énoncé 


e Les lois de la physique ont la même forme dans deux référentiels galiléens R 
et R’ différents. 


e La lumière se propage dans tout référentiel galiléen À avec une vitesse c bien 
déterminée indépendante de l’état de mouvement du corps émetteur. 


La première assertion est l’extension à toutes les lois de la physique du principe de 
relativité galiléenne figurant dans le paragraphe 1.1.1 qui concernait alors uniquement 
celles de la dynamique. Elle s’applique maintenant aussi aux équations de Maxwell 
de l’électrodynamique. Elle implique qu'aucune expérience de physique interne à un 
référentiel galiléen ne permettra de déceler le mouvement de ce référentiel par rapport 
à un autre. C’est le cas en particulier de l’expérience de Michelson. 

Pourquoi ce principe de relativité est-il qualifié de « restreint » ? C’est qu’il ne 
concerne que les référentiels galiléens et donc que les mouvements uniformes. Ein- 
stein a étendu ensuite ce principe au cas des mouvements accélérés : c’est l’objet 
de ce qu’on appelle la théorie de la relativité générale, que nous évoquerons au cha- 
pitre 9. Pour simplifier les expressions, nous qualifierons souvent de « principe de 
relativité » le principe de relativité restreinte. 


3.1.2 Conséquence sur la définition du temps 


Le principe de relativité restreinte a une forme extrêmement simple qui permet d’éli- 
miner par une sorte de pirouette le problème posé par le résultat négatif de l’expé- 
rience de Michelson. Mais il a de profondes implications sur notre conception du 
temps, que l’on peut immédiatement voir sur l’exemple suivant. 

Considérons l’horloge (H) schématisée sur la figure 3.1. Il s’agit d’une « cavité 
optique Fabry-Pérot », comme nous en avons déjà rencontré dans l’encart 2.3, consti- 
tuée de deux miroirs M, et M; se faisant face et séparés par une distance £. Le miroir 
M, est parfaitement réfléchissant et le miroir M; a un coefficient de transmission 
faible mais non nul. Dans cette cavité un dispositif (analogue à celui existant dans un 
laser) permet d’entretenir une brève impulsion lumineuse qui fait l’aller-retour entre 
les deux miroirs à intensité constante. Une faible partie de cette impulsion sort de la 
cavité à travers le miroir M. On obtient ainsi à la sortie du dispositif laser une succes- 
sion périodique de brèves impulsions lumineuses séparées de f = 2{/c qui constituent 
le «tic-tac » de l’horloge. Si la distance £ est maintenue parfaitement constante, on a 
ainsi une horloge d’une extrême précision. Ce type d’horloge est actuellement utilisé 
dans de nombreuses expériences de physique et de métrologie. Il permet de définir le 
temps du référentiel R dans lequel la cavité est au repos. 
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3.1. Principe de relativité restreinte 

















Figure 3.1- Horloge constituée de deux miroirs M, et M, se faisant face et émettant 
ses « tic-tacs » sous la forme de brèves impulsions lumineuses régulièrement espacées. 
a) L’horloge est au repos par rapport à l'observateur. b) L’horloge est en mouvement par 

rapport à l’observateur. 


Que se passe-t-il si l'horloge (H) est animée d’un mouvement uniforme de vi- 
tesse V perpendiculaire à son axe par rapport au référentiel galiléen R’ de l’observa- 
teur ? Dans ce référentiel les miroirs se déplacent, et la lumière fait des allers-retours 
obliques à cause du phénomène d’aberration (figure 3.1b). La distance parcourue par 
la lumière entre deux réflexions sur les miroirs M, et M; vaut maintenant une valeur 
€" qui est donc plus grande que £. Maïs le principe de relativité restreinte impose que 
la vitesse de la lumière est la même dans les référentiels À et À’, tous deux galiléens. 
Les impulsions qui sortent du laser sont donc séparées dans le référentiel R’ d’un 
temps # = 2{’/c > t. La même horloge ne bat pas au même rythme, et donc n'in- 
dique pas la même heure, selon qu’on observe les impulsions qu’elle émet dans À ou 
dans R’. Comme f’ > f, il y a ralentissement de l’horloge lorsqu'elle est en mouve- 
ment, et donc « dilatation du temps » défini par une horloge se déplaçant par rapport 
au temps défini par une horloge immobile. 

Il faut donc admettre que Le temps n’est pas absolu mais dépend du référentiel 
dans lequel on se place. I en résulte qu’on doit modifier l'expression 1.6 de la trans- 
formation des coordonnées, c’est-à-dire les transformations de Galilée, puisqu'elles 
comportent la relation 1’ = f. 

On pourrait objecter que le raisonnement précédent ne s’applique qu’à l'horloge 
laser H, et pas à une horloge H; fonctionnant différemment et qui donnerait un temps 
indépendant du référentiel. Mais alors, en comparant dans un référentiel donné les 
temps donnés par H;, et H;, donc par une mesure interne, on pourrait en déduire la 
vitesse relative des deux référentiels, ce qui est contraire au principe de relativité. 
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3.1.3 Conséquence sur la vitesse des objets matériels 


Une deuxième conséquence importante du principe de relativité est que la vitesse 
d’un objet matériel ne peut dépasser celle de la lumière. 

Supposons, en effet, qu’un observateur situé en O’ puisse se déplacer à une vitesse 
supérieure à c par rapport au référentiel R. Alors une impulsion lumineuse émise 
à l'instant £ = 0 d’un point A situé sur la partie négative de l’axe Ox ne pourra 
jamais l’atteindre, et celui-ci n’observera jamais l’arrivée de l’impulsion. Plaçons- 
nous maintenant dans le référentiel R’ où l’observateur est au repos : l’impulsion 
lumineuse s’y propage le long de l’axe O’x aussi à la vitesse c et finira par atteindre 
l'observateur immobile, qui pourra donc par une mesure « interne » déterminer s’il 
est dans le référentiel R ou À’ ce qui est contradictoire avec le principe que nous 
venons de poser. 

Le principe de relativité impose donc une contrainte physique à tous les mouve- 
ments possibles. Il interdit par exemple l’existence d’un mouvement uniformément 
accéléré, qui conduit inévitablement à des vitesses tendant vers l’infini. Nous verrons 
dans le chapitre 7 comment les lois de la dynamique relativiste assurent effectivement 
cette limitation sur les vitesses. 


3.2 TRANSFORMATIONS DE LORENTZ 


3.2.1 Synchronisation des horloges dans un référentiel 
galiléen 


Nous venons de voir que le temps, qui paraissait comme s’écouler de la même ma- 
nière dans tous les référentiels, est en fait relatif et non absolu lorsqu'on confronte le 
fonctionnement réel d’une horloge au principe de relativité. Une horloge permet de 
définir sans ambiguïté le temps à l’endroit où elle se trouve, par exemple à l’origine O 
des coordonnées du référentiel R. Mais qu’en est-il pour le temps mesuré en un autre 
point M du même référentiel ? L'utilisation d’horloges identiques en ces deux points 
permet de s’assurer de l’identité de l’unité de temps en O et en M. Il faut alors définir 
un processus de synchronisation des horloges. I] s’agit d’une question pratique d’une 
extrême importance, qui se pose concrètement par exemple sur le web, où la synchro- 
nisation précise des temps à l’échelle terrestre est nécessaire pour la transmission des 
données. 

Il est nécessaire pour cela que les deux horloges échangent un signal, ce qui ne 
peut se faire à une vitesse supérieure à celle de la lumière, comme nous venons de 
le voir. Des impulsions de champ électromagnétique sont en général utilisées à cette 
fin, par exemple dans les horloges radio-pilotées, qui sont connectées par onde radio 
à une horloge de référence de très grande précision, ou des récepteurs GPS qui sont 
connectés aux horloges embarquées dans les satellites GPS. 
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3.2. Transformations de Lorentz 


La procédure est la suivante : dans un premier temps l’horloge de référence située 
en O envoie dans toutes les directions une brève impulsion qui est renvoyée vers 
O par un miroir situé en M. La mesure du temps f; d’aller-retour de l’impulsion 
permet de déterminer la distance OM = ct;. Dans un deuxième temps l’horloge 
située en O envoie vers M une impulsion à l’instant = 0 de cette horloge. Cette 
impulsion est reçue en M où l’opérateur « met à l’heure » son horloge en appelant 
t = OMC = t,/2 l'instant où il a reçu l’impulsion. Le fait de tenir ainsi compte 
du temps de propagation du signal entre les différents points du référentiel permet 
effectivement de définir un temps commun à tous les points du référentiel. 


3.2.2 Transformation des coordonnées spatio-temporelles 
dans un changement de référentiel galiléen 


L'utilisation de règles identiques, d’horloges identiques dans deux référentiels ga- 
liléens R et R’, et du processus de synchronisation que nous venons de détailler, 
permet de définir les coordonnées (f,x,y,z) et (1”,x’,y’,z') d’un même événement 
(section 1.2.1) dans ces deux référentiels. On appelle transformation de Lorentz la 
transformation qui relie (?”,x’,y”,z’) à (r,x,y,z). Nous ne donnerons pas de démons- 
tration de l’expression de cette transformation dans ce cours d’introduction. Elle doit 
respecter le principe de relativité que nous venons d’énoncer ainsi que des proprié- 
tés plus générales, comme l’indépendance par rapport à l’origine des temps et des 
coordonnées, ainsi que d’isotropie de l’espace. 

Le principe de relativité implique que les équations de Maxwell de l’électrodyna- 
mique doivent avoir la même forme dans deux repères galiléens. On peut donc aussi 
trouver les transformations de Lorentz en cherchant les transformations des coordon- 
nées et des champs qui laissent invariantes les équations de Maxwell. C’est de cette 
manière que Lorentz, avant Einstein, avait donné l’expression des équations 3.1. 

Pour simplifier leur écriture, nous nous placerons dans le cas où le référentiel R’ 
animé d’une vitesse uniforme V par rapport à R, est défini comme indiqué dans le 
paragraphe 1.2.2 : son axe O’x’ coïncide avec Ox, direction de la vitesse V, les deux 
autres axes restant à tout instant parallèles (figure 1.1). L'origine des temps f = 0 est 
prise à l’instant où les points O et O’ coïncident. L’expression de la transformation 
de Lorentz £,(V) est alors dans ce cas : 


V 

r=y(-—) (3.1) 
G 

x = y(x- Vi) 

y =y 

= 

avec 1 
D —— (3.2) 


ee 
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V/c 


Figure 3.2 - Variation des quantités > et y ! en fonction de V/c. 


Remarquons que le temps dans le référentiel R’ dépend de V comme on s’y atten- 
dait, mais aussi de la position x. 

La variation de y avec V est donnée sur la figure 3.2 : il s’agit d’un paramètre 
toujours plus grand que 1 qui diverge lorsque V s’approche de c et qui n’est pas 
défini pour V > c, ce qui est conforme aux conclusions du paragraphe 3.2.3. Remar- 
quons que lorsque V  c, la transformation de Lorentz tend comme il se doit vers la 
transformation de Galilée introduite au chapitre 1. Plus précisément y diffère de 1 de 
moins de 0,1 % tant que V/c < 0,04c = 13 000 km.s”-!. Les écarts à la transformation 
de Galilée sont donc très faibles sauf lorsqu'on s’approche de très près de la vitesse 
de la lumière (y = 2 pour V = 200000 km.s”!). Ils sont néanmoins accessibles aux 
mesures d’extrême précision, ou accumulées sur des temps très longs. C’est le cas 
notamment des mesures de localisation de type GPS pour qui les corrections rela- 
tivistes à la transformation de Galilée jouent un rôle extrêmement important. Nous 
reviendrons plus en détail sur ce point au chapitre 6. 


3.2.3 Propriétés de groupe des transformations de Lorentz 


La transformation s’inverse aisément, et on a : 


F+2) 
Se ere 
C 


x = y(xX + VF) 


y=Y 
z=Z (3.3) 
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3.2. Transformations de Lorentz 


On a ainsi 20 = £,(—V). On peut, en outre, montrer que la composition de deux 
transformations Z,;(V) et Z,(V”) est une autre transformation £,(V”). L'ensemble 
des transformations {£,(V)} forme donc un groupe, le groupe spécial de Lorentz, 
ayant Z,(0) pour élément neutre. 

Ce groupe est un sous-groupe du groupe de Lorentz total qui comporte toutes 
les transformations entre coordonnées d’espace-temps de deux référentiels galiléens 
quelconques. On montre en particulier que le groupe de Lorentz total n’est pas com- 
mutatif : £,(V) o LV”) # LV”) o Lx(V). 


3.2.4 Représentations dans l’espace-temps 


La forme 3.1 des transformations de Lorentz semble compliquée, et on peut en cher- 
cher d’autres formulations. La linéarité de ces relations permet une écriture matri- 
cielle dans un espace à quatre dimensions, l’espace-temps ou espace de Minkowski. 
On définit un quadrivecteur position Ë d’un événement E dans un référentiel R par 
ses quatre coordonnées (cf,x,y,z), toutes homogènes à des longueurs. Au changement 
de référentiel décrit dans le paragraphe précédent est alors associée une matrice de 
changement de base : 


"= L(VE (3.4) 
L,(V) étant la matrice 4 x 4 : 
y —yV/cO0 
UT A G.5) 
0 0 O1 


On peut aussi simplifier l’écriture des coefficients de la matrice en introduisant la 
rapidité « définie par : 


tha = V]c (3.6) 
y vaut alors ch«, d’où l’on déduit : 
cha —sha 0 0 
LV) = Lo=| ne A de GT 
0 0 O1 
Il est facile de voir qu’avec ce paramétrage : 
L,{a} o L,{a’} = L,{a + a’} (3.8) 
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3.2.5 Invariants relativistes 


Les objets mathématiques qui ont la même forme dans tous les référentiels galiléens 
sont appelés invariants relativistes. Ils jouent un rôle physique important en raison de 
leur caractère intrinsèque. Nous en mentionnons ici quelques-uns. Nous en découvri- 
rons d’autres dans la suite de ce cours. 

Considérons tout d’abord la quantité : 


S=ct-x -ÿ -7 (3.9) 


En utilisant (3.7), il est facile de voir que : 


= cr? x? y? 7? = (ctcha- xsha) -(xcha - ctsha)” - y? - 7? = 5? (3.10) 
si l’on se rappelle que ch?a — sh°a = 1. 

Cette quantité prend donc la même valeur dans tous les référentiels galiléens. Elle 
n’est par contre pas toujours positive, et ne peut donc pas être utilisée comme une dis- 
tance au sens propre. Nous verrons sa signification physique dans le chapitre suivant. 

L’équation d’onde (2.7) est invariante par transformation de Lorentz : un calcul 
analogue à celui que nous venons d’effectuer pour s montre que si (2.7) est vérifiée 
pour une onde A(x,y,z,t) dans le référentiel R, A’(x’,y’,z/,1’) vérifie de même : 





l © ® ® ® 
+, : : : A! 4 2 #. =f) 2 (1 
È ot? x? oy"? =) G ÿ 37 ) ( ) 


Une solution de cette équation dans le référentiel À est l’onde plane À = 
Aocos(wt — k : r + #), avec w?/c? — K? = 0. Cette solution a la même forme dans 
R' où elle s’écrit A = Apcos(w’t” — K’ - r’ + D). On a donc : 


wc? - k? = w/?/c? -k’? (3.12) 


C’est donc bien un invariant relativiste. 
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EFFETS RELATIVISTES 
SUR LE TEMPS 
ET L'ESPACE 


Nous allons voir dans ce chapitre les premières conséquences des transformations 
de Lorentz introduites dans le chapitre précédent. Elles concernent le temps et l’es- 
pace, qui sont maintenant fortement liés l’un à l’autre de par la forme même de ces 
transformations. 

Considérons deux événements distincts. Nous les matérialiserons par exemple par 
de brefs flashs lumineux émis par des lampes de petites dimensions. Nous mettrons 
le premier, Eo, à l’origine des coordonnées d’espace-temps dans le référentiel À. Les 
relations (3.1) impliquent alors que toutes ses coordonnées d’espace et de temps sont 
nulles dans n’importe quel référentiel galiléen dont les origines coïncident lorsque 
t = 1 = (0. Le second est situé en un temps (f) et en un point M de coordonnées 
(x,y,z) du même référentiel. Pour simplifier la discussion, restreignons-nous au cas 
où M est situé sur l’axe Ox (y = z = 0). On peut donc représenter l’événement 
correspondant par un point quelconque du plan (x,cf) de la figure 4.1, l’événement 
E5 se situant à l’origine des coordonnées. 


4.1 INTERVALLE TEMPOREL : RELATIVITÉ 
DU PASSÉ, DU FUTUR ET DE LA SIMULTANÉITÉ 


Considérons tout d’abord l’intervalle temporel entre l’événement £0 de coordonnées 
(x = 0,f = 0) et un événement quelconque de coordonnées (x,f). Dans le référentiel 
R, cet intervalle Af est égal à 1 — 0 = r. Dans le référentiel À’, il vaut : 


Af =t —0= y(t- Vx/c?) (4.1) 


Il dépend donc du référentiel, comme on pouvait s’y attendre après la discussion du 
chapitre précédent sur la relativité du temps. 

Remarquons tout d’abord que le signe de l'intervalle de temps At’ dépend du réfé- 
rentiel. Prenons par exemple f > 0 : dans le référentiel R l’événement E a lieu après 
l'événement Eo. Mais si E est situé en un point M tel que x > c?t/V alors (4.1) im- 
plique que Af’ < 0 : dans le référentiel R’ l'événement E a lieu avant l'événement Es. 
On constate donc que, dans le monde relativiste, les notions de passé et de futur n'ont 
pas de sens absolu, puisqu'elles dépendent du référentiel dans lequel on se place. 
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Figure 4.1- Classification des événements par rapport à l'événement origine Es. 


Cherchons maintenant l’ensemble des événements qui se produisent au même ins- 
tant que Eo. Dans R, ce sont tous les événements caractérisés par f = 0, qui sont donc 
sur l’axe Ox du schéma de la figure 4.1. Dans À’, ils sont caractérisés par f” = 0, et 
se trouvent donc sur la droite D’ d’équation ct = xtha = xV/c de la figure 4.1, car 
les événements sont repérés sur cette figure par des point dont les coordonnées sont 
données dans le référentiel R. On constate que ces ensembles d'événements sont dif- 
férents dans les deux référentiels : la notion de simultanéité perd donc, dans le monde 
relativiste, le caractère absolu qu'elle avait en physique classique. La relativité de la 
simultanéité est une des conséquences les plus importantes et les plus troublantes de 
la transformation de Lorentz. 

On peut se faire une idée moins abstraite de cette relativité de la simultanéité en 
considérant l’expérience de pensée suivante, schématisée sur la figure 4.2 : deux dé- 
tecteurs sont disposés en deux points À et B de l’axe Ox de coordonnées —d et +d 
dans le référentiel R. Une source lumineuse est disposée à l’origine O’ des coordon- 
nées du référentiel R’. Elle se déplace donc à la vitesse V le long de l’axe Ox par 
rapport aux détecteurs. Elle émet dans les deux directions de l’axe Ox une impulsion 
lumineuse à l’instant f = f’ = 0 où les deux référentiels coïncident. Analysons ce qui 
se passe dans les deux référentiels : 


e dans le référentiel À lié aux détecteurs les deux flashs parcourent des distances d 
égales et arrivent donc en même temps aux points À et B où 1ls sont détectés ; 
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4.2. Intervalle d’espace-temps 












Figure 4.2 - Illustration de la relativité de la simultanéité. 


e dans le référentiel R’ lié à la source où la vitesse de la lumière est aussi c, les deux 
flashs ne seront pas observés en même temps, car pendant le temps de propagation 
de la lumière, le détecteur À s’est éloigné de la source lumineuse, tandis que le 
détecteur B s’en est rapproché. 


À cause de l’égalité de la vitesse de la lumière dans les deux référentiels, les événe- 
ments « arrivée de la lumière issue de © en À et B » sont donc bien simultanés dans 
un référentiel et non simultanés dans l’autre. 


4,2 INTERVALLE D’ESPACE-TEMPS 
4.2.1 Définition 


Dans le paragraphe 3.2.5 du chapitre précédent, nous avons vu que, à la différence 
de l'intervalle temporel, la quantité s° définie en (3.9) ne dépend pas du référen- 
tiel dans lequel on la calcule. Nous définirons l'intervalle d'espace-temps As entre 
deux événements Æ; et E; de coordonnées d’espace-temps respectives (f1,X1,y1,z1) 
et (12,X2,y2,22) dans un même référentiel À par la relation : 


As = (ti — 12) — (x — 2) — (gi — y2)° — (1 - 2) (4.2) 


En ramenant, par changement de l’origine des coordonnées et des temps, un des 
événements en (0,0,0,0), on peut utiliser la démonstration du paragraphe 3.2.5 pour 
en déduire que l'intervalle d'espace-temps As ne dépend pas du référentiel utilisé. 
Comme toujours en physique, la mise en évidence de quantités intrinsèques, c’est-à- 
dire invariantes sous certaines transformations, joue un rôle important dans la com- 
préhension des phénomènes en jeu. Nous allons voir dans le paragraphe suivant que 
c’est bien le cas pour l’intervalle d’espace-temps. 
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4.2.2 Classification des intervalles d’espace-temps 


Considérons à nouveau l’événement Eo, situé à l’origine des temps et des coordon- 
nées, et un événement E se produisant en un point de l’axe Ox, de coordonnées 
(t,x,y = z = 0), représentés sur la figure 4.1. Le signe du carré de l’intervalle 
d’espace-temps As? = c?f? — x? entre ces événements permet de définir trois si- 
tuations physiques bien différentes, correspondant à trois régions différentes du plan 
(x, ct) de la figure : 


e 1) As? = 0 : intervalle de genre lumière 


On a alors x = +ct (droites C, et C- sur la figure 4.1). Si f > O, le flash lumineux 
émis en O à f = 0 atteint M au moment exact où celui-ci émet son propre flash. Si 
t < 0, c’est le flash émis en M qui atteint O au moment où 1l émet son flash. 


e 2) As° < 0 : intervalle de genre espace 


On a alors |x| > cffl (région 1, et événement E; de la figure 3.2) : le flash lumineux 
émis en 0 (qui se propage selon la droite C,) atteint M après que celui-ci a émis son 
propre flash (ou l’inverse). Ce flash arrive « trop tard » : il n’y a pas de « contact », 
c’est-à-dire de lien physique possible entre les événements £, et E;, puisque toute 
transmission ne peut se faire qu’avec une vitesse inférieure ou égale à celle de la 
lumière. 


e 3) As? > 0 : intervalle de genre temps 


On a alors cffl > [x] : le flash lumineux émis en 0 atteint M avant que celui-ci 
n’émette son propre flash (ou l’inverse). Le déclencheur du flash en M a eu un 
contact avec le déclencheur du flash en © : il y a un lien physique possible, ou 
transmission d’information, entre les deux événements. 


Dans cette dernière situation, on peut faire une distinction supplémentaire entre la 
région 2 où As? > Oetr > 0, et la région 3 où As? > Oet r < 0. En effet, dans ces 
régions le signe de l’instant où se produit l’événement E ne dépend pas du référentiel. 
Considérons par exemple l’événement EF; de la région 2. Alors dans un autre référen- 
tiel #’ = y(t — vx/c?) sera aussi positif pour les événements E> de x < 0. Pour ceux de 
x > 0, on a dans la région 2 x < cf, et donc # > y(t — wt/c) = yt(1 — v/c). L’instant f’ 
des événements de la région 2 est donc positif pour n’importe quelle transformation 
de Lorentz. De même les événements Æ; de la région 3, un raisonnement analogue 
montre qu’ils se produisent à un instant négatif dans tout référentiel galiléen. 

Les régions 2 et 3 définissent donc des propriétés de l’événement E intrinsèques, 
indépendantes du référentiel : la région 2 est le futur de l’événement origine Eo, lieu 
de tous les événements pouvant avoir un lien de causalité avec l'événement origine, 
la région 3 le passé de l’événement £Eo, où c’est l’inverse. Cette distinction entre 
le passé et le futur n’est pas possible dans la région 1, où l’antériorité dépend du 
référentiel, comme nous l’avons vu dans le paragraphe précédent, et dans laquelle il 
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4.3. Longueur propre et contraction des longueurs 


ne peut y avoir aucun lien de causalité, n1 dans un sens n1 dans l’autre. Cette région 1 
est souvent appelée l’ailleurs de Eo. 

Les événements se produisant dans le plan x0y et pas seulement sur l’axe Ox sont 
décrits dans un espace à trois dimensions (x,y,ct). Le lieu des événements Æ qui ont 
un intervalle d’espace-temps nul avec l’événement origine est un cône de révolution 
autour de l’axe des temps, qualifié de cône de lumière, et les régions 1 (genre espace), 
2 (genre temps, futur) et 3 (genre temps, passé) y sont toujours bien définies par les 
signes de As? et de r. On ne peut donner de représentation graphique de ces régions 
pour des événements quelconques de l’espace-temps à quatre dimensions, mais il est 
d’usage de conserver le nom de cône de lumière à la surface d’équation As? = 0 dans 
cet espace. 


4.3 LONGUEUR PROPRE ET CONTRACTION 
DES LONGUEURS 


Considérons un objet matériel rigide aux extrémités duquel sont gravés deux points, 
et que nous appellerons «règle ». {Q est la distance entre ces deux points mesurée dans 
le référentiel dans lequel cet objet est au repos. Cette quantité est appelée longueur 
propre de la règle. 

Quelle est la longueur de cette règle quand elle est mise en mouvement, ou, ce 
qui revient au même, quand l’observateur se déplace par rapport à la règle ? Pour 
répondre à cette question, 1l faut d’abord définir précisément le protocole de mesure. 
On en envisagera ici successivement deux, schématisés sur la figure 4.3 : 


— (1) Dans le premier protocole, la règle, au repos dans R, est disposée entre les 
points O et À de l’axe Ox de ce référentiel. L’observateur se trouve au point O’ du 
référentiel R” : il note les instants ,, et 7, de son référentiel où sa position coïncide 
avec les extrémités O et À de la règle. Il en déduit la longueur £” de la règle dans 
R' par : 

L'=V( -t0) (4.3) 


Dans la configuration choisie, on a évidemment to = 0. Quant aux abscisses x 
et x’ de l’extrémité de la règle dans les deux référentiels, elles sont liées par la 
transformation de Lorentz : 

x = y(x + VF) (4.4) 


avec x = {9. Le moment f, où l’extrémité de la règle passe en O” est celui où 
x” vaut zéro soit , = {o/(yV), et la longueur de la règle vue de R’, donnée par 
l'expression (4.3), vaut finalement : 


g =" (4.5) 
y 
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Figure 4.3 - Différentes manières de mesurer la longueur d’un objet en mouvement 
par rapport à l’observateur : a) le temps de passage de l'extrémité A de la règle est 


mesuré par une horloge située en ©; (b) le temps d’arrivée d’une impulsion émise par O 


et réfléchie par A est mesuré par une horloge située en O et corrigé du temps de 
propagation. 


y étant supérieur à 1, {”’ est inférieur à & : c’est le phénomène de contraction 
des longueurs. L'effet ne peut dépendre que de la vitesse relative entre les deux 
référentiels et la relation (4.5) s’applique donc aussi au cas de la longueur d’un 
objet mobile mesurée depuis un référentiel fixe. 


(2) Le deuxième protocole est utilisé très fréquemment dans les mesures de dis- 
tances et de longueurs d’objets lointains : il s’agit de la méthode du radar, qui 
consiste à envoyer une impulsion de champ électromagnétique (micro-onde ou 
optique) sur un objet et à mesurer l'instant f où la lumière réfléchie par l’objet 
revient sur l’émetteur, c’est-à-dire l'instant de l’« écho ». Si l’objet est fixe, la dis- 
tance de l’objet à l’émetteur vaut alors ct/2. Cette technique permet de mesurer la 
longueur d’une règle située le long de la ligne de visée grâce à la mesure de la 
différence entre les temps d’arrivée fc et fn des échos renvoyés par les deux extré- 
mités de la règle. Si la règle est au repos par rapport à l’opérateur radar on a alors 
{= «tp — tc)/2. 
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4.3. Longueur propre et contraction des longueurs 


Qu'en est-il pour une règle en mouvement ? II faut ici prendre garde au fait que 
comme les deux extrémités de la règle ne sont pas atteintes par l’impulsion lumineuse 
aux mêmes instants, la règle s’est déplacée entre ces deux instants : on mesure donc 
la somme de la longueur de la règle et de son déplacement. Il faut alors retrancher ce 
déplacement pour obtenir la longueur de la règle. On voit donc que la longueur d’un 
objet n’a de sens que si on mesure la position de ses extrémités au même instant dans 
un référentiel donné. La simultanéité n’étant pas une notion absolue, comme nous 
l'avons vu, il en est de même de la longueur des objets. 

Précisons le dispositif : la règle, au repos dans À’, est disposée entre les points O’ 
et À’ de l’axe O’x’ de ce référentiel. L’observateur se trouve au point O du référen- 
tiel R. Il émet à f = 0 une impulsion lumineuse le long de l’axe Ox, dont la position 
dans R à l’instant f est donnée par x; = ct. Quant à l’extrémité de la règle où l’on 
a disposé un miroir pour réfléchir l’impulsion lumineuse, sa position x4 à l’instant 
dans R est donnée par la transformation de Lorentz x, = {5 = y(x4 — Vf). L’ins- 
tant fA de la rencontre dans R entre l’impulsion et l’extrémité de la règle correspond 
à X4 = X; soit : 

lo 


= -n y) (4.6) 


LA 
tA est la moitié de l’intervalle de temps mesuré par l’observateur entre l’émission et 
la réception de l’impulsion. La distance parcourue par l’impulsion cf4 est la somme 
de la longueur de la règle et du déplacement de son extrémité dans le référentiel À, 
cta = € + VfA, d’où l’on déduit : 

Y 
On retrouve ainsi, par un autre type de mesure de longueur, le même phénomène de 
contraction des longueurs. 

Les protocoles que nous venons de traiter concernaient une règle disposée parallè- 
lement au mouvement relatif des deux référentiels et ne peuvent s’appliquer pour une 
règle perpendiculaire au mouvement, disposée le long de la droite Oy par exemple, 
et il faut donc en envisager d’autres pour mesurer la longueur de la règle dans ce 
cas. Quel que soit le protocole utilisé, son analyse s’appuiera sur la transformation 
de Lorentz des coordonnées y, qui sont inchangées dans cette transformation : il n’y 
aura donc pas d’effet dans cette configuration. 1! n’y a de contraction des longueurs 
que le long du mouvement. 

Enfin, remarquons qu’il ne faut pas confondre longueur de la règle mesurée dans 
un référentiel en mouvement par rapport à celle-ci, et vision de la règle par un ob- 
servateur en mouvement. Dans le premier cas les distances entre points sont évaluées 
à un instant identique pour tous les points, alors que dans le deuxième cas, la dif- 
férence des temps de propagation de la lumière depuis les différents points jusqu’à 


€ (4.7) 
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l'observateur joue un rôle important. Il y a alors déformation apparente de l’objet en 
mouvement, une sorte d’effet relativiste de perspective. 


4.4 DURÉE PROPRE ET DILATATION DES DURÉES 


Considérons maintenant l’effet d’un changement de référentiel sur les durées. Pour 
être plus précis, prenons un objet ponctuel (H) (une horloge) qui émet deux brèves 
impulsions lumineuses, deux « tic-tacs » de l’horloge. Soient f; et /> les instants 
d'émission de ces impulsions. On appelle durée propre ou temps propre la difré- 
rence To = f2 — {, entre ces deux instants mesurés dans le référentiel dans lequel cet 


objet est au repos. 








Figure 4.4 - Différentes manières de mesurer la durée entre deux « tops » émis par 
l'horloge (H) : a) Un observateur en O’ observe le passage de la règle; b) Une impulsion 
lumineuse envoyée de © est réfléchie par le miroir M situé à l’extrémité de la règle. 


On veut maintenant mesurer la durée entre ces deux impulsions lorsque l’objet H 
a un mouvement de vitesse V par rapport au référentiel À de l’observateur. On peut 


ici aussi envisager plusieurs protocoles de mesure (voir Figure 4.4). 


— (1) Plaçons nous dans le cas où (H) se trouve à l’origine O” du référentiel R’. On 
a disposé à intervalles réguliers dans le référentiel R et le long de l’axe Ox un 


46 


2015 Dunod. 


Copyright € 


© Dunod. Toute reproduction non autorisée est un délit. 


4.4. Durée propre et dilatation des durées 


ensemble d’observateurs munis d’horloges. La première impulsion, émise à #” = 0, 
est observée immédiatement en © à l’instant fr = 0 du référentiel À. La deuxième 
impulsion est observée en un point B d’abscisse xZ et à un instant donné 8 du 
référentiel R. Utilisons la transformation de Lorentz inverse liant les coordonnées 
de cet événement dans les référentiels À et R’ : 


tB = Yi» + Vxglc?) (4.8) 


On a x, = 0 dans le référentiel R’. D’autre part #, est la durée propre To et fg est la 
durée 7 dans le référentiel de l’observateur. On a donc finalement : 


T = YTO (4.9) 


(2) On peut aussi comme dans la section précédente envisager un protocole de 
mesure de durée utilisant des impulsions lumineuses émises par l’horloge (H) et 
reçues par l’observateur. (H) est positionnée par exemple à l’origine O’ du ré- 
férentiel À’, et l’observateur à l’origine O du référentiel R. L’horloge émet vers 
l’observateur une impulsion lumineuse le long de O’x’ dans la direction des x’ né- 
gatifs à 7, = 0 et une autre à f, = To. Cette impulsion se propage à la vitesse c, 
et sa position x” à tout instant f’ ultérieur dans À’ est donnée par x’ = —c{(f” — To). 
L’observateur au point © du référentiel R reçoit la première impulsion à #, = 0. 
Quant à la deuxième, l’équation de son mouvement dans À est obtenue en utilisant 
la transformation de Lorentz : 


7 = VD = -c{y(t- Vale?) - To) (4.10) 


Elle atteint l’observateur lorsque x = 0, donc à l’instant r; donné par f; = To/(y(1 — 
V/c)). II faut maintenant tenir compte du fait que la source s’est éloignée entre les 
deux impulsions d’une longueur Vr dans le référentiel À, où 7 est le temps qui 
sépare les deux impulsions dans R. L’impulsion lumineuse a donc passé dans R 
un temps Vr/c à parcourir ce trajet supplémentaire. II faut donc le retrancher à f; 
pour obtenir l’intervalle de temps 7 entre impulsions dans R corrigé des effets de 
propagation. On obtient : 

T=t;- Vr/c (4.11) 

soit : 
_ li — TO _— 
TT 1+Ve ya -V/e) 


On retrouve ainsi, par un autre type de mesure de temps basé sur l’enregistrement 
d’impulsions de champ électromagnétique, le même phénomène de dilatation des 
temps. 


YTO (4.12) 
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Comme dans le paragraphe précédent, l’effet ne dépend que de la vitesse rela- 
tive entre les deux référentiels et la relation (4.9) s’applique donc aussi au cas de 
la durée entre deux « tic-tac » d’une horloge fixe mesurée depuis un référentiel en 
mouvement par rapport à celle-ci. y étant supérieur à 1, 7 est supérieur à To : c’est 
le phénomène de dilatation des durées. Xl en résulte qu’une horloge bat moins vite 
lorsqu'un observateur en mouvement en mesure les « tic-tac », comme nous l’avions 
vu qualitativement dans le chapitre précédent en considérant l’horloge à impulsions 
lumineuses. Ce phénomène est aussi appelé « ralentissement des horloges ». 


4.5 LES « JUMEAUX DE LANGEVIN » 


La contraction des longueurs et la dilatation des durées sont des phénomènes « appa- 
rents », comme peut l’être un effet de perspective : ils concernent la description d’un 
même phénomène physique du point de vue de différents observateurs, pas le phé- 
nomène lui-même. Mais les transformations de Lorentz ont aussi des conséquences 
mesurables sur les phénomènes physiques, comme l’a souligné Langevin en considé- 
rant l’expérience de pensée dite des « jumeaux de Langevin ». 

Considérons deux horloges identiques F, et H; positionnées initialement à l’ori- 
gine O d’un référentiel galiléen. H, reste immobile en ce point, tandis que H; est 
mise en mouvement, se déplace ensuite à vitesse constante V jusqu’en un point M, 
rebrousse chemin lorsque M est atteint, effectue le déplacement inverse de M à O à 
la même vitesse, et est enfin immobilisée au point © où se trouve l’horloge FH. Il est 
alors possible de comparer les temps indiqués par les deux horloges. Langevin avait 
formulé le problème de manière plus imagée, remplaçant les horloges par deux frères 
jumeaux dont l’un effectuait un voyage spatial en fusée, le point M par une étoile, et 
comparé les âges des jumeaux plutôt que les temps indiqués par les horloges. 

Faisons l’hypothèse que le temps 2d/V pris pour le déplacement OMO est beau- 
coup plus long que la somme des temps pris par les phases d’accélération, d’inversion 
de la vitesse et de décélération, et que ces phases de mouvement non uniforme ont 
une influence négligeable sur le fonctionnement de l’horloge H;. Cette hypothèse est 
corroborée par le traitement exact du problème dans le cadre de la relativité générale, 
qui est bien au-delà du niveau de cours d’introduction. Nous pouvons alors oublier 
ces phases et ne prendre en compte que les deux trajets à vitesse uniforme. Au mo- 
ment de la rencontre finale, l’horloge immobile H, indique donc le temps #1 = 2d/V. 
Qu'en est-il pour l’horloge H;, ? Dans son référentiel, la longueur OM est affectée 
par la contraction des longueurs d’un facteur 1/y. La distance totale parcourue n’est 
donc que de 2d/y, et le temps passé dans le référentiel de H; pour effectuer le tra- 
jet OMO sera f = 2d/(Vy) : ce sera le temps que l’horloge FH; indiquera lors de 
son rendez-vous avec l’horloge H, plus petit que #1, la différence entre les temps des 
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deux horloges étant de l’ordre de Vd/c?. Pour les jumeaux, celui qui a voyagé a vu son 
temps biologique ralenti : 1l sera plus jeune que le jumeau sédentaire. Par exemple, 
au bout du voyage aller-retour de 40 ans effectué à V = 0,2c jusqu’à Proxima du 
centaure, distant de quatre années-lumière, la différence des âges entre les jumeaux 
sera de 0,8 années. 

Remarquons que ce résultat résulte aussi bien du phénomène de dilatation des 
temps que de contraction des longueurs : dans le référentiel À où la longueur du 
trajet est d, le temps pris par le trajet OM est dilaté par le facteur y par rapport au 
temps propre de l’horloge H;, et on a donc yf = 2d/V. 

En outre, l’effet n’est pas réciproque : on ne peut pas inverser les rôles de FH, et H; 
puisqu’une horloge ne peut pas à la fois avancer et retarder par rapport à l’autre. Les 
lois de la physique ne sont donc pas les mêmes dans les référentiels liés à chacune 
des horloges, ce qui semble voler le principe de relativité. En fait, il n’en est rien car 
si le référentiel lié à H, est galiléen, il ne peut en être de même du référentiel lié à H3. 
En effet, l’horloge H; connaît des phases d’accélération au départ, de changement de 
direction de la vitesse ensuite, et de décélération à l’arrivée : elle ne se trouve donc 
pas à tout instant dans un référentiel galiléen. Le principe de relativité ne s’applique 
donc pas dans cette configuration. 


4.6 DES EXPÉRIENCES DE PENSÉE 
AUX EXPÉRIENCES RÉELLES : DURÉE 
DE VIE DES PARTICULES ET HORLOGES 
EN MOUVEMENT 


Les effets relativistes sur le temps et l’espace ont pour l’instant été illustrés par des 
expériences de pensée avec des objets macroscopiques pour lesquels V/c < 107 ty- 
piquement, c’est-à-dire pour lesquels y ne diffère de 1 que de quelques 106. Pour 
accéder à des effets mesurables, et donc tester effectivement la validité et l’utilité de 
la théorie de la relativité restreinte, 1l faut soit faire des mesures sur des objets micro- 
scopiques approchant la vitesse de la lumière, soit faire des mesures d’une extrême 
précision sur des objets macroscopiques de grande stabilité. Nous allons voir dans ce 
paragraphe un exemple récent pour chacune de ces situations. 


4.6.1 Durée de vie du muon 


Le muon est une particule élémentaire qui est une sorte d’« électron lourd » : il a 
la même charge, mais une masse 207 fois plus grande, que l’électron. Le muon est 
instable et se désintègre au bout d’un certain temps f pour donner naissance à un 
électron, facilement détectable, et à deux neutrinos. Comme nous le verrons plus en 
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Figure 4.5 - Anneau de stockage de muons pour l'expérience muon g-2 aux États-Unis. 
(source : Brookhaven National Laboratory, http://muon-g-2.fnal.gov) 


détail dans le chapitre 12, ce temps n’est pas fixe mais varie aléatoirement, ce qui 
est une des caractéristiques quantiques les plus importantes (et les plus troublantes) 
des phénomènes microscopiques. Néanmoins, lorsqu'on part d’un très grand nombre 
initial No de muons, le nombre moyen W(f) de muons subsistant au bout d’un temps 
obéit à une loi bien définie. Il est donné par : 


N(t) = Noe”" (4.13) 


où 7 est le temps moyen de désintégration, qui vaut To = 2,198 + 0,02 us pour des 
muons au repos. 

Les physiciens ont construit de grands dispositifs appelés « anneaux de stockage » 
qui permettent de maintenir pendant très longtemps des particules élémentaires char- 
gées sur une trajectoire circulaire avec une vitesse proche de celle de la lumière. 
Nous décrirons ici, pour être plus précis, une expérience réalisée en 1977 par une 
collaboration de chercheurs européens (J. Baïley et al, Nature, vol. 267, p. 301) sur 
l’anneau de stockage de muons du CERN, analogue à celui de la figure 4.5). L’an- 
neau a un diamètre de 14 m. Des muons dont la vitesse v = 0,9994c correspond à 
y = 29,327 + 0,004 sont injectés dans celui-ci à l'instant = 0. 20 compteurs d’élec- 
trons disposés autour de l’anneau permettent de mesurer avec précision le nombre de 
désintégrations N(f) en fonction du temps écoulé après l’injection. Ces données com- 
parées à la loi (4.13) permettent de déterminer expérimentalement le temps moyen de 
désintégration, qui est trouvé égal à 7 = 64,37 + 0,03 us. Le temps de désintégration 
constitue ainsi une horloge interne pour le muon, dont la caractéristique temporelle 
est précisément définie dès lors qu’on moyenne les mesures sur un grand nombre de 
muons. To est alors le temps propre de cette horloge. On constate que cette horloge a 
ralenti effectivement par un facteur T/To = 29,28 = y qui est très important à cause 
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Figure 4.6 - L'horloge atomique ACES-PHARAO, embarquée sur la station spatiale 
internationale, permettra de synchroniser très précisément des horloges situées sur des 
continents différents. 

(source : CNES : htip://smsc.cnes.fr/PHARAO/Fr/GP_platform_aces.htm) 


de la grande vitesse des muons mesurés. De plus la prévision théorique donnée par la 
relativité est vérifiée par l'expérience avec une précision relative de l’ordre de 0,2%, 
bien que le mouvement effectif des muons dans l’anneau soit circulaire donc non 
uniforme. 


4.6.2 Horloges en mouvement 


Les horloges les plus précises actuellement sont les « horloges atomiques » : elles 
consistent en une source de rayonnement électromagnétique monochromatique dont 
la fréquence y est asservie sur une transition entre deux niveaux d’énergie E; et Es 
d’un atome selon la relation de Bohr (chapitre 13) : 


hy = E> —-E; (4.14) 


où h est la constante de Planck. L'unité de temps est définie par rapport à une transi- 
tion entre niveaux de l’atome de Césium : par définition de la seconde, ou du Hertz 
son inverse, la fréquence vo de la transition entre les deux niveaux de plus basse 
énergie de l’atome de Césium vaut vo = 9192631 770 Hz. Comme tous les atomes 
de Césium de l'Univers sont strictement identiques (c’est une autre des propriétés 
quantiques troublantes du monde microscopique) deux horloges à Césium différentes 
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donneront le même temps, aux erreurs expérimentales près. Des générations de phy- 
siciens se sont attachées à réduire au maximum ces erreurs, en utilisant des sources 
de rayonnement (masers ou lasers) de très grande stabilité et des atomes les plus im- 
mobiles possibles, c’est-à-dire les plus froids possibles. La différence entre les temps 
mesurés par deux horloges atomiques identiques pendant une seconde est en 2011 in- 
férieure à 107!7 s dans le meilleur des cas. Sur les 14 milliards d’années, qui sont l’âge 
de l’Univers, de telles horloges auraient donc un désaccord inférieur à 5 secondes ! 
On conçoit donc que de tels instruments soient capables d’observer les très faibles 
effets relativistes qui existent sur des objets qui se déplacent à de faibles vitesses. 


Nous allons maintenant décrire une des expériences qui illustrent le mieux le « pa- 
radoxe » des jumeaux de Langevin. Elle a été réalisée en 1985 à bord de la navette 
spatiale Challenger : elle a consisté à comparer les temps donnés par des horloges 
à Césium de grande stabilité, les unes embarquées à bord de la navette, les autres 
restées à terre. Lors du retour à terre de la navette, au bout d’une semaine restée sur 
orbite, on constata un décalage des horloges embarquées de 180 us avec le temps 
donné par les horloges restées au sol, décalage très largement supérieur à la dérive de 
ces horloges les unes par rapport aux autres sur le même intervalle de temps. L’effet 
observé est plus précisément de —295,02 + 0,29 ps par seconde de vol. On voit donc 
que les jumeaux de Langevin ne sont pas un simple amusement de théoricien : l’effet 
peut effectivement être observé lorsqu’on dispose d’instruments suffisamment précis. 


La comparaison de cette observation expérimentale avec la théorie n’est pas simple 
car ni la Terre ni la navette ne constituent des référentiels galiléens. Cependant, la 
vitesse orbitale de la navette (7700 m.s-!) est bien supérieure à celle de la surface 
de la Terre (environ 4,6 m.s"!), et on peut considérer en première approximation que 
les horloges au sol appartiennent à un référentiel galiléen, alors que celles qui sont 
dans la navette appartiennent à un référentiel non galiléen en mouvement de rotation 
uniforme par rapport au précédent. La vitesse orbitale de la navette permet de calculer 
un effet relativiste de dilatation des temps, y"! —] = u?/2c?, valant 3,3.107!0, soit 330 
ps par seconde. La différence avec la valeur mesurée a deux origines. Le premier effet 
est lié au fait que le référentiel de la navette est en rotation : il en résulte un décalage 
«gyroscopique » de fréquence de l’horloge. Le deuxième effet provient de la relativité 
générale et nous l’aborderons dans le chapitre 9. Il est dû au fait que la fréquence 
d’une horloge dépend du champ de gravitation dans lequel elle se trouve : une horloge 
au sol et une horloge à l’altitude de l’orbite de la navette (330 km), même immobiles, 
donnent des temps légèrement différents. La détermination précise de l’ensemble de 
ces effets permet de prédire un décalage temporel en très bon accord avec la valeur 
mesurée, ce qui constitue une confirmation supplémentaire du phénomène relativiste 
de dilatation des durées. Par extrapolation, on en déduit que Sergey Krikyalov, qui 
est à ce jour le cosmonaute resté le plus longtemps en orbite (803 jours cumulés sur 
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plusieurs vols) est maintenant revenu sur Terre plus jeune de 20 ms que ses collègues 
restés à Terre ! Mentionnons finalement le projet spatial ACES-PHARAO, qui a pour 
but d’installer dans la station spatiale internationale une horloge atomique dans le 
but de synchroniser avec une très grande précision les horloges de toute la Terre et de 
mesurer les différents effets de modification des durées mesurées dans des référentiels 
différents (Figure 4.6). 
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EFFETS RELATIVISTES 
SUR LES VITESSES 


Nous nous intéressons dans ce chapitre aux effets relativistes sur les vitesses, c’est-à- 
dire à la cinématique relativiste. Ces effets concernent aussi bien les objets matériels 
macroscopiques ou microscopiques, que la lumière envisagée sous sa double forme 
ondulatoire ou corpusculaire. 

On considèrera donc un objet matériel ponctuel mobile situé en un point M 
dépendant du temps. Dans le référentiel galiléen R il a pour coordonnées spa- 
tiales (x(r),y(r),z(1)). Dans un autre référentiel galiléen R’ ses coordonnées sont 
(x (1),y/(1),z/ (1°). On appellera v et v’ son vecteur vitesse dans l’un ou l’autre réfé- 
rentiel, qu’il faut se garder de confondre avec la vitesse V de déplacement de R’ par 
rapport à À. 


5.1 COMPOSITION DES VITESSES EN RELATIVITÉ 


5.1.1 Loi de composition des vitesses 


Plaçons-nous dans le cas des transformations de Lorentz spéciales où la vitesse V est 
parallèle à l’axe Ox des référentiels R et R’ (figure 1.1). La composante v’ selon O’x’ 
de la vitesse du point M dans le référentiel R’ est donnée par : 


, _ dx dx dt dx'Jdt 


OS RL 5.1 
ap — dtdt  dfjdt ie, 





La transformation de Lorentz (3.1) permet de calculer ces deux dernières dérivées : 





dx dt Vu, 
— -n +=y(- | 52 
SN) sy (5.2) 
et on a finalement : v 
/ Ux — 
= — 5.3 
CNT Vu, /c? QE 
On a de même : 
/ Uy / Uz 
= ———— ; = ———— 5.4 
V ya = Ve) ‘ 7 yA- Vie) nl 


Lorsque les vitesses v et V sont toutes deux petites devant c, cette relation se réduit 
comme il se doit à la loi de composition des vitesses en cinématique classique v} = 
Uxy — V; U, = vy;0. = v,. Notons aussi qu’à la différence de la loi classique, la loi 


& 
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relativiste aboutit à une modification des composantes v,, et v! de la vitesse, à cause 
du facteur dt/df’, c’est-à-dire de l’effet de dilatation du temps. 
La transformation inverse s’écrit : 


/ / / 
0 nd | Uy V, 


= , W= "<< A —————— © ———— 
1 + Vu!/c? 7 y(1 + Vul/c?) 7 y + Vui/c?) 


Ux 


(5.5) 


5.1.2 Loi de composition de vitesses parallèles 


Considérons tout d’abord un mobile M dont la vitesse v par rapport à R est parallèle à 
Ox. Les relations (5.3) et (5.4) impliquent que sa vitesse v’ par rapport à R’ est aussi 
parallèle à Ox avec les relations : 


, u—V | v'+V 


 — 5.6 
1e litre G:6) 


Si la vitesse v’ de M par rapport au référentiel R’ vaut c/2, et que ce référentiel 
est animé d’un mouvement de vitesse V = c/2 par rapport à À, la vitesse v de M par 
rapport à À vaut 0,8c au lieu de la valeur c que donnerait la cinématique classique. 
La loi relativiste de composition des vitesses n’est donc pas une simple loi d’addition 
des vitesses. 

Utilisons ici le paramétrage par la rapidité introduit au paragraphe 3.2.4 (rela- 
tion 3.7). Appelons respectivement &, a’ et «Rg les rapidités associées aux vitesses 
v, v’ et V. On a alors : 


tha’ + thœR 


thQ = —— 
” 1 +tha' thœr 


= th(@” + @R) (5.7) 


d’après une relation connue de trigonométrie hyperbolique. On a alors : 
a=@ +aR (5.8) 


Les rapidités, et non les vitesses, s’additionnent donc simplement lorsque les mou- 
vements sont parallèles. Cette relation permet aussi de voir que lorsque V = c ou 
v’ = c, alors à’ — © ou &g — ©, ce qui entraine & — co donc v = c : on ne peut pas 
rajouter une vitesse, aussi grande soit-elle, à la vitesse de la lumière, qui est bien une 
limite supérieure à toute vitesse possible. 


5.1.3 Émission de photons par une source en mouvement 


Considérons ici la lumière comme formée de photons, envisagés ici comme des cor- 
puscules classiques se déplaçant à la vitesse c, et plaçons-nous dans le cas où ces 
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photons sont émis par le point O” origine du référentiel À’ dans le plan x’Oy’ dans 
une direction faisant un angle 4’ avec la direction du mouvement Ox’. On a donc pour 
la vitesse v’ du photon dans À’ : 


YA / : = : / 
v, = CCos® ; v,=csin0 (5.9) 


Les composantes de la vitesse v du photon dans le référentiel R sont alors : 


V+ccosg c sin 0’ =0 (5.10) 


du Vcos®'/c ” Lu y(A + V cos #//c) DFE 


Un calcul simple montre que v? = v? + v + v? = c? : le photon se propage donc bien 


aussi à la vitesse c dans le référentiel À, ce qui est conforme au principe de relativité 
sur l’invariance de la vitesse de la lumière, et reste dans le plan xOy. Sa trajectoire 
dans R fait un angle 0 avec Ox tel que : 


sin 0” 


= Cdi Vo (5.11) 


tg0 


On constate qu’en général 4 Æ 6”, sauf pour 4 = 0 ou 7. Il en résulte que, à l’exception 
des photons émis strictement vers l’avant ou vers l’arrière, la lumière émise par un 
point en mouvement change de direction de propagation lorsqu’on l’observe dans un 
référentiel au repos (ou de manière équivalente lorsqu’un observateur en mouvement 
observe une source lumineuse immobile) : c’est la version relativiste exacte du phé- 
nomène d’aberration que nous avons rencontré dans sa version classique approchée 
à la section 2.2.2 et que nous retrouverons quand nous décrirons la lumière comme 
une onde (section 5.2.2). 

La figure 5.1 donne la variation de 8 en fonction de 6’ pour différentes valeurs du 
rapport V/c. On constate que si la vitesse V de la source se rapproche de celle de 
la lumière, l’angle 4 est proche de zéro pour toutes les valeurs de 4’, à l’exception 
de celles qui sont très proches de x. Par exemple, si le photon se propage selon Oy, 
perpendiculairement au déplacement de la source, alors 1g0 = 1/y : sa direction se 
rapproche de celle de la direction du mouvement de la source. Si la source se dé- 
place à une vitesse V = c et émet des photons de manière uniforme dans toutes les 
directions du référentiel R’, alors l’immense majorité de ces photons se propagera 
dans des directions très proches de l’axe Ox lorsqu'on les observera dans le réfé- 
rentiel R (figure 5.2). En particulier, la moitié des photons, émis dans R’ avec des 
angles 0 < 0 < x/2, seront observés dans le référentiel À à l’intérieur d’un cône très 
étroit de demi-angle au sommet 1/y et dans la direction du mouvement : il y aura 
concentration de la lumière autour de la direction de propagation de la source. 
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Figure 5.1- Variation de l’angle de propagation du photon dans 8’ en fonction de 
l’angle de propagation du photon dans &’ pour trois valeurs de V/c : 0 (a), 0,5 (b), 0,99 (c). 





Figure 5.2 - La lumière émise dans #, référentiel se déplaçant à la vitesse V par 
rapport à À, l’est dans toutes les directions, alors que dans £& elle est émise à l’intérieur 
d'un cône extrêmement étroit. 


5,2 TRANSFORMATION DE LORENTZ 
POUR UNE ONDE 
5.2.1 Invariance de la phase d’une onde 


Envisageons maintenant la lumière comme un phénomène ondulatoire : comme nous 
l’avons vu dans le paragraphe 2.1, une onde lumineuse plane et monochromatique est 
alors décrite dans un référentiel À par la quantité complexe oscillante : 


A(T,r) = Ao e iot-kr) = À) e iPUx) (5.12) 
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5.2. Transformation de Lorentz pour une onde 


La phase ®(1,r) de l’onde peut être considérée comme caractérisant un événement 
se produisant en un point donné à un instant donné (le maximum de l’onde, son 
annulation, le nombre d’oscillations...). Elle doit prendre donc la même valeur dans 
tous les référentiels galiléens : c’est un invariant relativiste, et on doit donc avoir pour 
tout (t, r) 


wt-k-r=wt -k'-r (5.13) 


où w et k sont la pulsation et le vecteur d’onde de la même onde dans le référentiel R’. 
En utilisant l’expression (3.1) de la transformation de Lorentz, et en exploitant le fait 
que la relation (5.13) doit être vérifiée en tout point (x,y,z) et à chaque instant f, on 
en déduit : 


&w = y(w’ + VK!) 
kx = y, + w’V{c?) 

k=K, 

EE (5.14) 


ou la transformation inverse : 


&" = y(& — Vk;) 

ke = yx — wV/c) 

k, =k, 

EE =k (5.15) 
Considérons alors le quadrivecteur ® caractérisant la phase de l’onde dans le réfé- 
rentiel R par ses quatre coordonnées (w/c,kx,k,,Kk;). On a alors : 


D = L,(V)® (5.16) 


où Z,(V) est la matrice 4 X 4 figurant dans l’équation (3.5) : on voit que pulsation 
et vecteur d'onde se transforment de la même manière que temps et position. Is ap- 
partiennent à une même catégorie de quadrivecteurs caractérisés par des propriétés 
mathématiques identiques vis-à-vis du groupe de transformations de Lorentz. Cette 
analogie formelle entre propriétés de la lumière envisagée comme particule ponc- 
tuelle et comme onde est extrêmement profonde : elle se prolonge en mécanique 
quantique dans la fameuse dualité onde-corpuscule que nous exposerons aux cha- 
pitres 10 et 13. Cette analogie a d’ailleurs servi de guide lors de l’élaboration de la 
théorie quantique. 
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5.2.2 Transformation du vecteur d’onde : aberration 


Revenons maintenant au problème du changement de référentiel pour la lumière déjà 
abordé au paragraphe 5.1.3 à l’aide d’une approche corpusculaire. Nous décrivons 
maintenant la lumière sous la forme d’une onde plane. Considérons le cas où, dans 
le référentiel R, elle a pour pulsation w et se propage dans la direction Oy. Dans 
le référentiel R’, elle a une pulsation &’ et un vecteur d’onde de module w’/c. Elle 
se propage dans le plan x/O'y’ dans une direction faisant un angle 6’ par rapport à 
l'axe Ox’. Les coordonnées du vecteur d’onde dans ce référentiel sont donc : 


k' = (w'/c)cos®" ; k, = (w’/c) sin 0’ (SA17) 
Les composantes du vecteur d’onde K du photon dans le référentiel À sont alors : 
k = y(w'/c)(cos 8" + V/c) :; ky=k, = (w'/c)sin# (5.18) 


Dans le référentiel À la même onde se propage donc dans le plan xOy dans une 
direction faisant un angle 6 par rapport à l’axe Ox tel que : 


sin 0” 


= Cr (5.19) 


tg0 
L’onde se propage selon une direction différente dans les deux référentiels, c’est le 
phénomène d’aberration que nous avions déjà vu pour une onde classique. Remar- 
quons qu’on trouve pour l’angle une expression identique à (5.11) démontrée pour 
une particule de vitesse c. Une fois de plus, approche ondulatoire et approche cor- 
pusculaire de la lumière aboutissent à des conclusions physiques identiques. 


5.2.3 Transformation de la pulsation : effet Doppler 
relativiste 


L'expression de la transformation de la pulsation peut aussi s’écrire de manière vec- 
torielle : 





w = y(w +k':V) = re (1 PR =) (5.20) 
C 


où et est le vecteur unitaire dans la direction du vecteur d’onde K’. C’est l’expression 
relativiste exacte de l’effet Doppler, effet qui a déjà été abordé dans le chapitre 2 et 
dont l’expression approchée classique est donnée par l’équation (2.13). 


e Si l’onde se propage dans R’ parallèlement à la vitesse V mais de O’ vers O, 
eg : V = —V. On a alors pour les longueurs d’onde dans les deux référentiels : 


>» IIIe 
2=12 "er (5-21) 
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5.2. Transformation de Lorentz pour une onde 


Cette dernière relation indique que À > 4’ pour V positif. Il y a décalage de la 
longueur d’onde vers les grandes valeurs, c’est-à-dire vers le rouge dans le cas d’un 
rayonnement visible, lorsque la source lumineuse s’éloigne de l’observateur : c’est 
le fameux red shift qui joue un rôle très important en astrophysique (encart 5.1). Si 
l’observateur se rapproche de la source, il y a décalage vers le bleu (blue shiff). Par 
exemple, un observateur à bord d’une voiture extrêmement rapide peut voir un feu 
de circulation comme vert alors qu'il est en fait rouge dans son propre référentiel. 
Il suffit pour cela qu’il roule à une vitesse v = c/4! 


Si l’onde se propage dans À’ perpendiculairement à la vitesse V, alors 
&" = yw # &. Il y a dans cette configuration non seulement aberration, mais aussi 
décalage Doppler de la pulsation, alors que ce n’est pas le cas pour l’effet Doppler 
classique. Cet effet Doppler transverse est uniquement dû à l’effet de dilatation du 
temps entre les deux référentiels. 


SEncarr 5.1 L'effet Doppler dans les observations astronomiques 


Les astronomes disposent sur leurs télescopes ou radiotélescopes de spectro- 
mètres extrêmement précis qui leur permettent de mesurer la longueur d'onde 
du rayonnement qu’ils observent. Grâce à la formule (5.20) de l’effet Doppler ils 
peuvent remonter à la vitesse des objets célestes, ce qui constitue un outil ex- 
trêmement puissant de connaissance de l'Univers, comme nous allons le voir sur 
les deux exemples suivants. 


1. Les radioastronomes Penzias et Wilson ont constaté en 1964 que la Terre 
baignait dans un rayonnement micro-onde venant de toutes les directions, 
appelé « fond diffus cosmologique ». Celui-ci est la trace actuelle du Big 
Bang qui s’est produit il y a 13,7 milliards d'années et a donné naissance 
à un rayonnement isotrope en expansion continuelle. Des mesures extré- 
mement précises du spectre en fréquence de ce rayonnement effectuées 
par des satellites (COBE, PLANCK, ..) ont montré que le spectre observé 
n'est pas le même lorsqu'on le mesure dans deux directions opposées de 
la voûte céleste : en particulier la longueur d'onde correspondant au maxi- 
mum d'émission diffère légèrement dans deux directions opposées. Il y 
a donc anisotropie du fond cosmologique, qui est due à la variation du 
décalage Doppler en fonction des directions relatives de l'onde et de la 
vitesse de l’observateur. La mesure du décalage Doppler dans la direction 
de l'Univers où cet effet est maximal donne la direction et l'amplitude de 
la vitesse de l'observateur par rapport au référentiel où le Big Bang s’est 
produit. On a ainsi trouvé une vitesse de l’ensemble du système solaire de 
627 km.s-! dans la direction de l’amas de l’Hydre. Ce décalage Doppler ne 
rend pas compte de la totalité des observations : l'écart observé par rap- 
port au décalage Doppler, extrêmement faible, est attribué à la structure 
de l'Univers au moment de la génération de ce fond diffus cosmologique : 
on peut donc ainsi « voir » l'Univers tel qu’il était peu de temps après le Big 
Bang. 
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2. Comme nous l’avons déjà souligné, les atomes d’un élément donné sont 
strictement identiques dans tout l'Univers, et ils émettent ou absorbent le 
rayonnement à des longueurs d'onde À, bien déterminées, liées à la posi- 
tion de leurs niveaux d'énergie. Le spectre d’un élément en constitue en 
quelque sorte la signature. Or les astronomes observent dans leurs téles- 
copes des spectres globalement identiques à ceux des éléments existant 
sur terre, mais à des longueurs d’onde observées souvent décalées par 
rapport aux valeurs mesurées sur terre. Ce décalage est évidemment dû à 
l’effet Doppler et la mesure de la quantité Z = (1- 4)/49 permet de remon- 
ter à la composante de la vitesse relative entre la Terre et l’objet observé 
sur la ligne de visée. 


La mesure des décalages Doppler Z de raies spectrales émises par les étoiles de 
notre Galaxie permet d’en déterminer la distribution des vitesses. On constate 
par exemple que le Soleil a une vitesse de 370 km.s-! par rapport au trou noir 
situé au centre de notre galaxie. On peut aussi observer des objets étranges ex- 
trêmement lointains, aux confins de l'Univers, les « quasars » et les « sursauts 
gamma », qui présentent de très forts décalages Doppler vers le rouge. Des va- 
leurs de Z supérieures à 6 ont été mesurées sur certains de ces objets, corres- 
pondant à des vitesses d’éloignement de l’ordre de 0,95c, pour lesquelles la 
formule relativiste de l’effet Doppler, et non pas son approximation classique, 
est indispensable. On voit ainsi que l'expansion de l'Univers aboutit à des vi- 
tesses relatives entre ses points les plus éloignés qui sont proches de celle de la 
lumière. 
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DEUX EXEMPLES 
DE PHÉNOMEÈNES 
RELATIVISTES 


Nous détaillons dans ce chapitre deux exemples de dispositifs dans lesquels la rela- 
tivité ne constitue pas une faible correction mais joue un rôle essentiel. Le premier 
exemple est un objet qui fait maintenant partie de notre environnement quotidien, 
puisqu'on le trouve, entre autres, dans beaucoup d’automobiles et de téléphones por- 
tables : il s’agit du système GPS de positionnement. Le second n’est pas aussi ré- 
pandu en raison de son coût et de sa taille, mais on en trouve maintenant de nom- 
breux exemplaires à travers le monde : il s’agit des sources de rayonnement synchro- 
tron très utilisées par les physiciens, les chimistes, les biologistes, les archéologues... 
pour caractériser très précisément la structure des molécules contenues dans leurs 
échantillons. 


6.1 LE GPS : UN LABORATOIRE RELATIVISTE 


La constance de la vitesse de la lumière a une conséquence pratique importante : lier 
de manière fondamentale mesures de distances et mesures de temps. En effet, dans 
tous les référentiels galiléens 1l suffit de multiplier le temps de propagation de la lu- 
mière entre deux points pour obtenir la valeur de leur distance. Aïnsi repère-t-on la 
position des étoiles en années-lumière. Rappelons aussi que l’étalon de longueur, le 
mètre, n’est plus une unité de base du système SI, car la définition du mètre est dé- 
rivée de l’étalon de temps, la seconde, définie par l’horloge à Césium : le mètre est 
la longueur parcourue par la lumière en (1/299 799 458)° de seconde. Pour position- 
ner un point dans l’espace, il suffit donc de mesurer les temps de propagation de la 
lumière entre ce point et des points de positions connues. C’est le principe du GPS, 
que nous allons maintenant détailler. 


6.1.1 Description du système de positionnement 


Le GPS (Global Positioning System) est un système de positionnement développé 
par les USA qui est maintenant accessible au grand public. La Russie a un système 
analogue, appelé GLONASS, et l’Europe est en train de déployer un système de 
nouvelle génération, appelé GALILEO. 
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La « constellation GPS » est constituée d’une trentaine de satellites situés à 
20 000 km d’altitude sur des orbites circulaires judicieusement disposées et parcou- 
rues en 12 h (Figure 1 de l’introduction à la relativité dans cet ouvrage). Chacun 
contient une horloge atomique à Rubidium synchronisée avec celles des autres sa- 
tellites. Ainsi, le temps et la position de ces satellites sont connus avec une extrême 
précision. Chaque satellite émet vers la Terre un signal micro-onde (aux alentours 
de 1,5 GHz) formé d’une succession de brèves impulsions, accompagnées de si- 
gnaux codés permettant d'identifier le numéro j du satellite et l’instant d'émission 
t; de l’impulsion. Le récepteur, situé au point de coordonnées (x,y,z) à déterminer, 
reçoit les signaux émis par les différents satellites qu’il a dans son horizon et en- 
registre le temps d’arrivée f;R de l’impulsion issue du satellite j par rapport à sa 
propre horloge. Il a en mémoire des données très précises concernant les satellites 
(et constamment remises à jour) qui lui permettent de connaître très précisément la 
trajectoire x;(f),y;(1),z;(r) du satellite numéro j. Malheureusement, l'horloge incluse 
dans le récepteur est de précision bien moindre que celle des satellites, et en particu- 
lier elle n’est pas synchronisée : le récepteur ne connaît donc le temps d’arrivée qu’à 
une constante additive inconnue près : fje = To + Ôt;r, où ôt;R est mesuré et To est 
inconnu. 

L’impulsion électromagnétique s’est propagée à la vitesse de la lumière entre émet- 
teur et récepteur et on a donc : 


= x) + Go = y) + —2)) = To + ôtjr — 1j) (6.1) 


Cette équation comporte quatre inconnues : x,y,z,10. Pour en déduire sa position 
en longitude, latitude et altitude, le récepteur a donc besoin des signaux provenant 
de quatre satellites différents, qui fourniront quatre équations de propagation dont 
la résolution donnera les valeurs des quatre quantités inconnues. Dans de bonnes 
conditions de réception et pour des temps de mesure suffisamment longs, l’incertitude 
sur la position trouvée est de l’ordre d’une dizaine de mètres, ce qui nécessite une 
précision absolue sur la mesure des temps de propagation de l’ordre de la dizaine de 
nanosecondes. 


6.1.2 Effets relativistes 


Les satellites se déplacent à une vitesse de 3 800 m.s”!, soit 7y-1=08Xx 16 
Il semblerait donc que les effets relativistes soient négligeables pour des objets aussi 
lents. Il n’en est rien en raison de la très grande précision nécessaire pour obtenir 
un positionnement précis. En effet, le décalage relativiste entre le temps au sol f 
et le temps f”’ du satellite vaut # — 1 = (y — 1}. Il est de 10 ns au bout de deux 
minutes, 300 ns au bout d’une heure, 7 us au bout d’un jour, correspondant à des 
erreurs de positionnement respectives de 3 m, 100 m et 2 km. La prise en compte de 
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6.2. Rayonnement synchrotron 


l’effet relativiste de dilatation du temps est donc absolument indispensable dans la 
détermination de la position. 

Il existe aussi un deuxième effet relativiste qui intervient dans le positionnement, 
mais cette fois-ci de relativité générale. Nous l’avons déjà rencontré dans le para- 
graphe 4.6.2 sur les horloges jumelles : l'horloge au sol et l'horloge embarquée sont 
situées à des altitudes h très différentes par rapport au centre de la Terre, et voient 
donc des valeurs très différentes du potentiel ® = GM/h du champ de gravitation (où 
M est la masse de la Terre et G la constante de gravitation). Or, comme nous le verrons 
au chapitre 9, le temps dépend aussi du potentiel de gravitation dans lequel se trouve 
immergée l’horloge, selon la formule (1-1 }/t = (d-'}Jc? = g(h-h'}c? = 3x107° 
où g est l’accélération de la pesanteur à la surface de la Terre. On voit que l’effet de 
relativité générale est même légèrement plus grand que celui de relativité restreinte 
(et en fait dans un sens opposé). Au bout d’une journée il aboutit à un décalage des 
horloges de —-45 us. L’effet total à prendre en compte est de l’ordre de —38 us par 
jour. 

S1 en revanche on connait aussi bien la position du récepteur que des satellites, la 
mesure des temps de propagation des signaux venant de satellites se trouvant dans des 
directions différentes permet de remonter à la vitesse de la lumière dans ces directions 
et fournit un test « gratuit« (c’est-à-dire ne nécessitant pas de développer de montage 
expérimental spécifique) de l’isotropie de la vitesse de la lumière, avec une précision 
relative de 107? (P. Wolf, G. Petit, Physical Review À t. 56, p. 4405 1997). 


6.2 RAYONNEMENT SYNCHROTRON 


6.2.1 Principe de fonctionnement 


On montre en électromagnétisme que toute charge en mouvement accéléré émet un 
champ électromagnétique. Par exemple, une charge dans un fil mise en mouvement 
sinusoïdal à la pulsation & par un courant alternatif rayonne dans toutes les direc- 
tions une onde électromagnétique à la même pulsation : c’est le principe de fonc- 
tionnement d’une antenne. De manière analogue, les électrons dont la trajectoire est 
courbée par un champ magnétique subissent une accélération centripète et émettent 
donc un champ : c’est ce qu’on appelle le rayonnement synchrotron. La figure 6.2 
donne une vue schématique du synchrotron SOLEIL mis en service en 2007 dans 
la région parisienne. Des paquets d’électrons, produits et accélérés dans la partie in- 
térieure à l’anneau circulaire, sont ensuite injectés dans l’anneau, qui a 350 mètres 
de diamètre, et où ils circulent à une vitesse V constante et proche de c caractérisée 
par un facteur y égal à 5 400. On insère sur le trajet des électrons des onduleurs (fi- 
gure 6.2), constitués par une succession d’aimants permanents alternativement nord 
et sud produisant un champ magnétique perpendiculaire à la trajectoire et oscillant 
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Figure 6.1- Schéma général du synchrotron SOLEIL. 
(source libre : http://fr.wikipedia.org/wiki/Synchrotron_soleil) 


spatialement avec une période spatiale p de 5 cm. Les électrons sont donc mis en 
mouvement oscillant par ce champ magnétique et donnent naissance à un rayonne- 
ment synchrotron qui est ensuite utilisé dans les différentes expériences installées sur 
les différentes « lignes de lumière » que l’on voit sur les bras tangents à l’anneau. 


6.2.2 Détermination des caractéristiques du rayonnement 
émis 

Appelons À le référentiel du laboratoire et R’ le référentiel animé d’une vitesse V 
dans la direction des onduleurs. Dans ce dernier référentiel, les électrons sont ani- 
més d’un mouvement oscillant autour d’une position moyenne fixe. Ils rayonnent un 
champ électromagnétique dans toutes les directions de À’ à la fréquence v’ de leur 
mouvement oscillant. Dans À’ les électrons voient passer à la vitesse —V des aimants 
qui sont distants de p/y = 10 ym. Il faut, en effet, tenir compte de l’effet de contrac- 
ton des longueurs dans le changement de référentiel, qui est ici très important vu 
la grande vitesse des électrons. La période de leur mouvement est donc p/yV, et la 
fréquence v’ = yV/p. 

Le rayonnement synchrotron est évidemment utilisé dans le référentiel À du labo- 
ratoire, et il faut donc effectuer maintenant la transformation de Lorentz de À’ à R 
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6.2. Rayonnement synchrotron 


aimants Champ Br impulsion 
permanents lumineuse 









trajectoire 


Figure 6.2 - Schéma d’un onduleur. 


sur l’onde émise pour en connaître les caractéristiques. On a alors un double effet 
relativiste : 


e l’effet d’aberration qui modifie la distribution spatiale du rayonnement : comme 
nous l’avons vu dans le paragraphe 5.2, l’essentiel du rayonnement est émis dans 
le référentiel À dans un cône étroit autour de la vitesse moyenne des électrons, 
c’est-à-dire de l’axe de l’onduleur, avec un demi-angle au sommet de l’ordre de 
y! = 2.10 *rd. Il s’agit donc d’un faisceau de rayonnement extrêmement directif ; 


° l’effet Doppler qui change la fréquence de l’onde. Dans la direction de la vitesse 
du référentiel qui est celle du maximum d'émission, la formule (5.20) donne pour 
la fréquence y de l’onde dans À : 


V 
v=yv(l+—-)z= = (6.2) 
€ p 


Pour SOLEIL, cette fréquence vaut 3,5.10/7 Hz, ce qui correspond à une longueur 
d’onde À de 0,8 nm : il s’agit donc d’un rayonnement X. 


Les synchrotrons tels que SOLEIL, qui sont maintenant extrêmement nombreux dans 
le monde, produisent donc un rayonnement extrêmement directif et monochroma- 
tique dans le domaine des rayons X, dont on peut changer la longueur d’onde en 
changeant l’énergie, donc la vitesse des électrons. À étant de l’ordre de grandeur des 
dimensions des atomes, des molécules ou des mailles cristallines, on conçoit que ce 
rayonnement constitue une extraordinaire sonde de ces objets microscopiques, sans 
rivale en termes de brillance et de monochromaticité. C’est la raison pour laquelle 
il est un instrument de prédilection pour les chercheurs de nombreuses disciplines : 
physique des atomes et des cristaux, mais aussi chimie, biologie, pharmacie et méde- 
cine, qui utilisent donc de manière routinière les effets relativistes que nous venons 
de détailler. 
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DYNAMIQUE 
RELATIVISTE 


Nous avons vu précédemment comment la description du mouvement (c’est-à-dire 
la cinématique) devait être modifiée pour satisfaire au principe de relativité. Dans ce 
chapitre, nous étudions comment doivent être reformulées les lois de la dynamique, 
c’est-à-dire, essentiellement, les liens entre forces et mouvement. 

En fait, si les lois de l’électromagnétisme et, par suite, l’expression de la force 
de Lorentz, sont en accord avec les transformations de Lorentz et le principe de re- 
lativité, nous allons voir qu’il n’en est pas de même pour les lois de la mécanique 
newtonienne, et qu’il nous faut revoir les définitions de l’énergie et de la quantité de 
mouvement si l’on veut conserver les principes usuels de la dynamique, à savoir le 
principe fondamental de la dynamique (PFD) et le théorème de l’énergie cinétique. 

La fin de ce chapitre, consacrée aux collisions relativistes, nous permettra d’illus- 
trer ces définitions par quelques exemples génériques. 


7.1 QUELQUES RAPPELS DE DYNAMIQUE 
CLASSIQUE 


Ces rappels concernent la dynamique classique des objets matériels et des champs 
électromagnétiques, et les formules considérées ne sont donc, a priori, pas relati- 
vistes. Nous mettons néanmoins l’accent sur le fait que les lois de Maxwell respectent 
le principe de relativité de Lorentz. 

Nous insistons également sur les lois de conservation (masse, quantité de mou- 
vement, énergie) sur lesquelles nous nous appuierons, dans les paragraphes suivants 
de ce chapitre, pour introduire les notions de quantité de mouvement et d’énergie 
relativistes. 


7.1.1 Dynamique newtonienne 


Comme on l’a vu au chapitre 1, la quantité de mouvement p d’une particule ponc- 
tuelle de masse m et de vitesse v est définie, en mécanique classique, par la relation 
suivante : 

p = nv (74h) 
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Chapitre 7 - Dynamique relativiste 


La façon dont cette particule évolue dans l’espace-temps galiléen est alors régie 
par le principe fondamental de la dynamique (PFD) : 


dp _ 


dd ma = F (7.2) 


où a = dv/dt est l’accélération de la particule et où F est égale à la somme des forces 
F; qui s’appliquent sur elle : 
F- à F; (7.3) 
î 


L'énergie cinétique (classique) de cette particule est définie par la relation : 


1 p° 
Ec = = 2 — 7.4 
2 2m Nes 
Elle est liée au travail des forces F; par le théorème de l’énergie cinétique : 
Wc (Æ) = Ec(B) — Ec (A) (7.5) 


où We (F) est le travail de la force F « le long du chemin C » : 


We (F) = F.dl = F;.dl 7.6 
c Œ) [ 2 l (7.6) 


et où £E.(B) et EQ (A) représentent les valeurs que prend l’énergie cinétique de la 
particule aux deux extrémités A et B du chemin. 

Nous verrons aux paragraphes 7.2 et 7.3 comment les expressions relativistes de 
la quantité de mouvement et de l’énergie cinétique diffèrent de celles rappelées 1c1. 


2.1.2 Constantes du mouvement classiques 


En mécanique classique, certaines quantités ne varient pas dans le temps et sont donc 
appelées des constantes du mouvement. Par exemple, la masse d’un corps est une 
constante du mouvement : 


m = constante (7.7) 


De même, pour un ensemble de corps pouvant réagir (chimiquement par exemple) 
et ainsi changer de structure, la masse totale de ces corps est une constante du mou- 
vement (loi de Lavoisier) : 


M = >. m; = constante (7.8) 
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7.1. Quelques rappels de dynamique classique 


Si l’ensemble de particules, de masse m; et de vitesse v;, est isolé, la quantité de 
mouvement totale est également conservée : 


P = >. miv; = constante (7.9) 


l 


Enfin, si les particules de cet ensemble isolé sont soumises à une force F dérivant 
d’un potentiel extérieur U (c’est-à-dire telle que F = —-grad(U), vecteur dont les 
trois composantes sont —-0U/0x, —-O0U/dy et -OU/02), l'énergie totale, c’est-à-dire la 
somme de l’énergie cinétique totale E. et de l’énergie potentielle U, est également 
une constante du mouvement : 


Eyotale = Eç + U = constante (7.10) 


Chacune de ces constantes du mouvement peut en fait être reliée à une propriété 
particulière des lois physiques qu’on appelle « symétrie » (encart 7.1). Ces symé- 
tries (parfois subtiles à appréhender), et les constantes du mouvement associées, sont 
généralement activement recherchées lors de la résolution d’un problème car elles 
permettent souvent de prédire la forme mathématique des solutions et de connaitre 
l’état final d’un système sans s’intéresser au détail de son évolution intermédiaire. 

Précisons que les constantes du mouvement ne sont pas à confondre avec les inva- 
riants relativistes introduits au paragraphe 3.3.5. 


SENcarr 7.1 Lien entre symétries et lois de conservation 


Il existe un lien étroit entre les lois de conservations (les constantes du mou- 
vement) et l'existence de « symétrie » des lois physiques associées, comme par 
exemple, la symétrie par translation dans le temps ou dans l’espace. Bien en- 
tendu, ces symétries particulières ne doivent pas être confondues avec les sy- 
métries usuelles des objets ou des formes géométriques (comme les multiples 
symétries du cercle par exemple). 


Le théorème de Noether précise alors que : 


« À chaque symétrie des lois de la physique correspond une loi de conservation 
(une constante du mouvement), et inversement ». 


Ainsi, à la symétrie par translation dans l'espace (c’est-à-dire à l'indépendance 
des lois de la physique vis-à-vis de l’origine spatiale des coordonnées), corres- 
pond la loi de conservation de la quantité de mouvement. 

On peut le montrer en considérant un système de particules dont l'énergie po- 
tentielle totale U est indépendante de la position globale du système (c’est-à-dire 
de son centre de gravité). Dans ce cas, les dérivées spatiales de U sont nulles et 
aucune force extérieure ne s’applique sur ce système. Le Principe Fondamental 
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de la Dynamique nous indique alors que la dérivée temporelle de la quantité de 
mouvement totale est nulle : 


dp 


REVUE (GAL) 


ce qui signifie que les trois composantes de p sont des constantes du mouve- 
ment. 

Une autre façon de comprendre cette relation est de considérer un système isolé 
de deux particules, repérées dans un référentiel galiléen par les vecteurs position 
r, et r, dont le potentiel d'interaction ne dépend que de la distance entre ces 
deux particules UÜ(r, — r,). Dans ce cas, on a: 


dpz 
dt 


dpi 


dt VU -r2) = +Vr,U (rs - n2) = - 


(7.12) 
et la dérivée temporelle de la quantité de mouvement totale p, +p est nulle. 

De la même manière, les lois de la physique sont indépendantes du choix de 
l’origine du temps, ainsi que de l’orientation dans l’espace des axes de coordon- 
nées. Il y a symétrie par translation dans le temps et rotation dans l’espace. On 
peut montrer qu’à ces deux symétries sont associées deux lois de conservation : 
celle de de l’énergie et celle du moment cinétique total. 

La plupart des lois de la physique sont également invariantes par inversion du 
signe des charges (conjugaison de charge « C »), par remplacement de t en -t 
(inversion du temps «T »), par symétrie des coordonnées par rapport à une ré- 
flexion dans un miroir (parité « P »). Ce sont des symétries plus subtiles, et qui 
peuvent être violées dans certaines interactions comme l'interaction faible (fi- 
gure 9.10). On montre en revanche que le produit des trois transformations PCT 
est conservé par toutes les interactions (pour plus d'informations, consulter les 
sites en.wikipedia.org/wiki/Noether%27s_theorems ou www-cosmosaf.iap.fr/Noether_et_le_ 
Lagrangien.htm) 


2.1.3 Et les lois de l’électromagnétisme ? 


L’électromagnétisme forme l’autre grand pilier de la physique classique. Or, nous 
avons vu aux chapitres 1 et 2 que, si les équations de la mécanique classique étaient 
bien invariantes par changement de référentiel galiléen, 1l n’en était plus de même 
pour les équations de Maxwell et la force de Lorentz. 


En revanche, et cela a joué un rôle fondateur dans la construction de la théorie 
de la relativité restreinte, les équations de l’électromagnétisme sont invariantes par 
transformation de Lorentz, à condition de transformer non seulement les coordon- 
nées (cf,x,y,z) mais également les composantes (E Eur) et (B,,B,,B.) des champs 
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1. Quelques rappels de dynamique classique 


électromagnétiques E et B (encart 7.2) par les expressions : 


E° = B' =B, 
E, = un BcB. ) er B, + BE-{c) (7.13) 
E= 7(E: 


= 7 
La BcB,) B' = = y(B: - BEylc) 


oùf= Vic. 

On remarque alors que les composantes de E et B ne se transforment pas exacte- 
ment comme (cf,x,y,z) : ce ne sont pas les éléments d’un quadri-vecteur mais ceux 
d’un tenseur, le tenseur champ électromagnétique. 

Précisons enfin que l’on peut associer à E et B une densité d’énergie & (qui, lors- 
qu’elle est absorbée par un corps, chauffe celui-ci) et une densité de quantité de mou- 
= &/c), qui se traduit par ce que l’on appelle une pression de radiation 
sur les objets éclairés (qui oriente la queue des comèêtes à l’opposé de la direction du 
Soleil et modifie la vitesse des atomes irradiés par des faisceaux laser par exemple). 





ENCART 7.2 Invariance relativiste des potentiels électromagnétiques 


On définit en électromagnétisme les potentiels scalaire et vecteur V et A, à partir 
desquelles on peut exprimer les champs électromagnétiques E et B : 


B=rot(A) et E=-VV -6A/ôt (7.14) 


Si l’on impose à ces potentiels de satisfaire en plus à la relation div (A)+ oV/ôt = 
0 (condition de jauge de Lorentz) on montre que les équations vérifiées par ces 
potentiels sont : 


o? Fe | SE AE 
(Se ox?  ôy? à) 


®? d? d? ®? 
(e = IL = yo) (7.15) 


où Pp et J sont respectivement la charge volumique et le vecteur courant volu- 
mique. 

On montre que ces équations sont invariantes par changement de référentiel Ga- 
liléen pourvu que l’on impose que les quantités (pc,J) et (V/c,A) se transforment 
de la même façon que les coordonnées spatio-temporelles (ct,x,y,2), c'est-à-dire 
par les mêmes transformations de Lorentz, par exemple : 


ea = =y(} - BA;) 
Az (Ax-B#) (7.16) 
A! — Az 


Utilisant les relations (7.14) pour revenir aux champs E et B, on obtient finale- 
ment les transformations (7.13). 
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7.2 QUANTITÉ DE MOUVEMENT RELATIVISTE 


7.2.1 Définition de la quantité de mouvement relativiste 


Si la quantité de mouvement totale d’un système physique est bien conservée en 
mécanique classique (section 7.1.2), l’encart 7.3 ci-dessous montre, sur un exemple, 
qu’elle ne l’est plus si l’on utilise la loi de composition relativiste des vitesses établie 
au chapitre 5. Un constat s’impose alors : afin de préserver le principe de conser- 
vation de la quantité de mouvement totale, il faut modifier la définition de celle-ci. 
Comment ? En tenant compte, comme indiqué dans l’encart, de l’effet de saturation 
des vitesses à travers le facteur y. 

Ainsi, par définition, la quantité de mouvement d’un objet ponctuel de masse m se 
déplaçant à la vitesse v par rapport à un référentiel galiléen est égale à : 


Il 


P= nv avec Yy= (7.17) 


fe 





Attention à ne pas confondre y,, où v est la vitesse de l’objet ponctuel dans le réfé- 
rentiel R, et le facteur y qui intervient dans la transformation de Lorentz, où V est la 
vitesse relative d’un référentiel par rapport à l’autre. 

Aux faibles vitesses, le facteur y, peut se développer en puissances de (v/c}° : 
Yo = 1+ + v?/c? + …, et l’on retrouve bien l’expression classique de p : 


p=mv si [vl<c (7.18) 


à des corrections relativistes près. 

Même si l’exemple détaillé en encart ne joue pas le rôle d’une démonstration, on 
peut tout de même souligner que cette définition est satisfaisante du point de vue du 
principe de relativité. En effet, la quantité de mouvement classique poassique = MdX/dt 
s’exprime en fonction de la distance dx, mesurée dans À, pendant la durée df, me- 
surée également dans À, alors que la quantité de mouvement relativiste P,oariviste = 
ymdx/dt = mdx/dr fait intervenir la durée propre dr du mouvement dans le référen- 
tiel lié à l’objet en mouvement, dr étant la seule durée qui ait un sens, en relativité 
restreinte, pour définir la vitesse d’un objet le long d’une trajectoire. 


NEncarr 7.3 Mise en défaut de la quantité de mouvement classique 


Il est particulièrement instructif de constater que la loi de conservation de la 
quantité de mouvement totale (par exemple, avant et après un choc élastique 
entre deux particules) conduit à une incompatibilité entre la loi de composition 
relativiste des vitesses (obtenue au chapitre précédent) et l’expression classique 
usuelle de la quantité de mouvement p = mv. 
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7.2. Quantité de mouvement relativiste 


En effet, considérons deux particules de même masse m, lancées suivant la même 
direction (Oz), en sens opposés, par deux observateurs A et B. À est immobile 
dans le référentiel À, et B, immobile dans le référentiel À’, se déplace parallè- 
lement à (Ox) à la vitesse v. À envoie sa particule, à la vitesse w, par rapport 
à lui-même, suivant l’axe (Oz). B envoie sa particule, également à la vitesse w 
par rapport à lui-même, suivant l’axe (O7). Il y a alors choc élastique de telle 
façon que les deux particules rebroussent chemin dans leur référentiel propre 
(figure 7.1). 





Figure 7.1- Choc élastique « symétrique » de deux particules. 


Intéressons nous à la quantité de mouvement totale du système, avant et après 
le choc. 


Si l’on considère l’expression classique p = >; mivi, on a alors : 
(pa + PB)avantiechoc = M(VA + VB) avant le choc (7.19) 
Or va = Uoe, dans R et V, = —Uoer dans &’. La loi de composition relativiste des 


vitesses (dont on ne remet pas en cause la validité, établie au chapitre 5) nous 
donne alors l'expression de la composante suivant l’axe (O2) de LA dans 8 : 


VA u 
PR (7.20) 
(1 +, Vic?) Yv 
puisque v,, = 0 et v,, = —-Uo. 
Ainsi : 
(Paz Parano = MU ( Te y | (7.21) 
V 
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Par le même raisonnement, on a après le choc (par symétrie uo <— —-uo) : 


L 
(Paz + P8z)après le choc = MUo È =] | (7.22) 


Yv 


d’où la violation de la conservation de la quantité de mouvement classique totale : 


(PA + P8)avant le choc # PA + P&)apres le choc (7.23) 


contrairement au cas purement non-relativiste où la loi de composition classique 
des vitesses (vs, = —-uo) redonne bien la loi de conservation (p4 + pg)uvantie choc = 
0 = (pa + PB&)après le choc: 

Considérons maintenant l'expression suivante pour la quantité de mouvement 
totale d’un système de particules : 


p= D yimivi (7.24) 
i 


où les facteurs y; = 1/,/1 _ VAI? rendent compte de l’effet relativiste de satura- 
tion des vitesses pour chacune des particules. 


Alors : . 2 
A 0 
(Paz) avant le choc = ———_—_—_——  ——— (225) 
JL= VaJce Al — ug/c2 
Le mv mu 
B 0 
(P8z)avant le choc = —— = - ——— (7.26) 
A1 - vie? UE Velce 
avec : 
Le 
V8 = (Ver)? + (Va)? = — + V? (7.27 
Yv 
d'où: 
1] — u£/c 
1] - Véics —_ (1 — vè/c?)(1 — uÿ/c?) = (Er, (7.28) 
Yv 
et par conséquent : 
(Paz + Pez)avant le choc = O (7.29) 


De même, par symétrie Uo <— —-Uo, On à (p4z + Pez)aprestechoc = 0, Et l'on retrouve 
bien ainsi la loi de conservation de la quantité de mouvement totale : 


(PA m P&)avant le choc — (PA h P&) apres le choc (7.30) 


C'est cette définition de p que l’on considèrera par la suite. 


2015 Dunod. 


Copyright € 


© Dunod. Toute reproduction non autorisée est un délit. 


7.2. Quantité de mouvement relativiste 


7.2.2 Principe fondamental de la dynamique relativiste 


Par analogie avec le lien entre quantités de mouvement classique poyssique = MY et 
relativiste P,uriviste = YMV, On peut réécrire le PFD sous une forme relativiste en 
faisant intervenir le temps (propre) mesuré dans le référentiel lié à l’objet en mou- 
vement : cb = ÿ';f;, où les forces f; sont les forces relativistes associées aux forces 
classiques F;. 

L'expression de ces forces f; peut s’obtenir simplement en considérant un référen- 
tiel galiléen particulier : le référentiel propre À’ de l’objet à un instant donné. La 
vitesse de l’objet étant nulle dans ce référentiel À’, il n’y a aucun effet relativiste (au 
moins pendant un bref intervalle de temps) et le PFD s’exprime de façon classique 
sous la forme su = »;F’;, où les forces F’; sont les forces classiques usuelles. En 
utilisant le lien entre la coordonnée temporelle f” (qui est aussi égale au temps propre 
T ici) et la coordonnée f, on peut montrer! que les forces relativistes f; s'expriment 
simplement en fonction des forces classiques F; sous la forme f; = yF;. Comme 
d - 72, le PFD garde alors une forme particulièrement simple en relativité res- 


dt | 
treinte : 


dp 
— — ? Ej 7.31 
Fe D) (7.30) 


pour un objet ponctuel de masse m soumis, dans À, à des forces F;, ces forces conser- 
vant leur expression classique habituelle. 


On peut aussi faire apparaître explicitement le vecteur accélération usuel a = à 
en dérivant p = ymnv par rapport au temps f : 
dp dy 
— = yma+mv = D Fi 7.32 


l 
qui ne redonne l’expression (presque classique) yma = ÿ;F; que pour des mouve- 
ments dont la norme de la vitesse v = |[v|| reste constante. 
Un exemple important est le mouvement d’une charge g évoluant dans un champ 
électromagnétique (E,B). Son mouvement obéit alors à l’équation suivante : 


En 
dt "dt defi-ve)e 





= q(E+vAB) (7.33) 


qui diffère de l’expression classique usuelle par une correction relativiste d’un facteur 
y et par un terme supplémentaire dépendant de la variation temporelle de la norme 
de la vitesse —. 

1. L'expression relativiste du PFD et des forces agissant sur un objet dans un référentiel quelconque peut 
s’obtenir beaucoup plus directement en utilisant la notion de quadrivecteur détaillée à la section 7.3.5. 
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7.3 ÉNERGIE RELATIVISTE 


7.3.1 Définition de l’énergie cinétique relativiste 


Elle est définie, comme dans le cas classique, par le théorème de l’énergie cinétique 
(Equation 7.5). On montre dans l’encart 7.4 que cela conduit à prendre pour l’énergie 
cinétique relativiste l’expression : 





E. = mc° (y, -— 1) (7.34) 





Aux faibles vitesses, le facteur y, — 1 = Fu?/c? + … redonne bien l’expression 

classique : 
l 
E, = LL si Ivl<c (7.35) 

à des corrections relativistes près. 

Au contraire, aux grandes vitesses (c’est-à-dire pour v approchant c), la quantité 
Lmv? «sature » à +mc? alors que l’énergie cinétique relativiste continue à augmenter 
indéfiniment : 


lime (mc? (yo — 1)) = +0 (7.36) 


SEncarr 7.4 Dérivation de l’expression de l’énergie cinétique 
relativiste 


Considérons le mouvement parallèle à l'axe (Ox), dans un référentiel donné, d’un 
objet de masse minitialement au repos. Le théorème de l'énergie cinétique s’écrit 
alors : 


AE, = 1 Fdx (7.37) 


c'est-à-dire : ; ; 
APÈ=E, — [om ax = [om vdt (7.38) 


Exprimons v en fonction de y, en inversant la relation 


w= UN -vae : vs at (7.39) 


Ce qui conduit à : 
Yv dyv 


dt 
2-1 
d’où : 


v dyv C 
ME nn. En e 1dt = mc° far-me (yv = 1) (7.41) 


mr (ymv) = mc (7.40) 
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7.3. Énergie relativiste 


7.3.2 Application : accélérateur électrostatique 
de particules 


Considérons à titre d'exemple d’application d’utilisation de l’énergie cinétique rela- 
tiviste le problème d’une particule chargée (masse m, charge g), initialement au repos 
à l’origine du référentiel R et soumise à un champ électrostatique E = Ee, uniforme. 
Le théorème de l’énergie cinétique relativiste s’écrit : 


W (gEe,) = [ gEdx = AE, = mc? (y — 1) (7.42) 
avec V (x) = Ex le potentiel électrostatique au point d’abscisse x. On obtient ainsi : 
Ex 
Y=1+% ou: 








(7.43) 
à comparer à l’expression classique (obtenue selon le même raisonnement) : 
2qgEx 
Uclassique — mn ” (7.44) 


Comme attendu, l’expression relativiste de la vitesse sature à c, la vitesse de la 
lumière, alors que l’expression classique n’a aucune limite supérieure (figures 7.2 
et 7.3). Cet effet de saturation est constamment vérifié dans les accélérateurs de par- 
ticules. 

Ce type d’accélérateur est utilisé dans le domaine de la médecine ou de l’indus- 
trie (utilisant les rayons X produits lors du brusque freinage des électrons issus de 
l'accélérateur pour faire de l’imagerie par exemple). 


7.3.3 Énergie interne d’un système composite 


Considérons un système composite, c’est-à-dire formé de sous-parties en interaction 
mutuelle, par exemple un noyau formé de nucléons, un atome ou une molécule formés 
de noyaux et d'électrons, un gaz ou un solide formés de molécules. L'énergie interne 
Enr d’un système composite est l’énergie totale du système lorsqu'il est globalement 
au repos et non soumis à des forces extérieures. Elle caractérise son état, c’est-à-dire 
l’agencement de ses composants et l’intensité des interactions entre ceux-ci. 
L'énergie interne joue un rôle important dans le premier principe de la thermo- 
dynamique et dans la description des réactions chimiques. Il y a variation d’énergie 
interne lors d’une transformation du système qui change l’agencement de ses compo- 
santes (lors de réactions chimiques par exemple), mais aussi lorsque sa température 
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Relativité restreinte 
Mécanique classique 


Énergie cinétique 





1 
Vitesse 


Figure 7.2 - Variation de l'énergie cinétique (relativiste et classique) en fonction de v/c. 
(source libre : http://en.wikipedia.org/wiki/Tests_of_relativistic_energy_and_momentum) 


Vic? 











Mécanique classique 
Relativité restreinte = 


Bertozzi a 
1 Le 


0 5 10 15 20 25 30 


0.6 1 1 1 ( 
Énergie cinétique / mc? 


Figure 7.3 - Résultats de l’expérience de Bertozzi en 1964 démontrant l'effet de 
saturation des vitesses d'électrons accélérés. 
(source libre : http://en.wikipedia.org/wiki/Tests_of_relativistic_energy_and_momentum) 


varie (il y a variation de l’énergie cinétique liée à l’agitation thermique). Du point de 
vue de la physique classique, la masse totale du système est conservée dans de telles 
transformations du système. En chimie, c’est la fameuse loi de Lavoisier. 
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7.3. Énergie relativiste 


Prenons l’exemple de la réaction chimique de formation de H,0 à partir de H; et 
0; : elle se produit par réorganisation des liaisons entre les atomes d’hydrogène et 
d'oxygène qui constituent le système composite, et entraine donc une variation de 
son énergie interne (mesurée à 1,2 x 108J pour une mole de H; et une demie mole 
de O3). La conservation de l’énergie totale au cours de la transformation implique 
que la réaction s’accompagne soit d’un fort dégagement de chaleur (augmentation 
de l’énergie d’agitation thermique) soit d’une explosion, c’est-à-dire d’une grande 
énergie cinétique de la vapeur d’eau produite, utilisée par exemple dans la propul- 
sion des fusées. Par contre, la loi de Lavoisier nous indique que la masse totale des 
composants est conservée dans une telle réaction chimique. 

D'un point de vue expérimental, on a par contre observé que lors des réactions 
nucléaires, qui changent l’agencement des nucléons et donc l’énergie interne du sys- 
tème, 1l n’y avait pas conservation de la masse totale. Nous y reviendrons plus en 
détail dans le chapitre 8. 

Les physiciens ont été amenés à poser qu’à toute variation de l'énergie interne est 
associée une variation de la masse totale du système, c’est-à-dire de sa capacité à 
être mis en mouvement par une force extérieure. Plus précisément, la relation entre 
variation d'énergie interne AE;,, et variation de masse associée AM s'écrit : 


AE;jy = AMc°? (7.45) 


ce qui aboutit, en prenant un choix commode de l’origine des énergies à la célèbre 
loi d’Einstein d’éguivalence entre masse et énergie d’un corps au repos : 


(7.46) 


où M est la masse totale du système composite qui intervient par exemple dans l’ex- 
pression (7.17) de la quantité de mouvement, et caractérise l’inertie du système. Cette 
expression a fait couler beaucoup d’encre depuis sa première formulation en 1905 par 
Einstein. Bien qu’il n’y ait encore à ce jour aucune démonstration rigoureuse satis- 
faisante?, cette expression est justifiée par ses conséquences expérimentales et par 
sa cohérence au sein de l’ensemble de la théorie de la relativité. On trouvera dans 
l’encart 7.5 la description d’une expérience de pensée qui rend plausible dans un cas 
particulier simple cette relation. 

Il est important de noter que la formule (7.46) est valable pour un système au re- 
pos : l’équivalence masse-énergie est le seul effet relativiste qui se manifeste à vitesse 
nulle. Il n’en est donc que plus étonnant, même si la variation de masse est la plupart 
du temps extrêmement faible : lors de la réaction chimique de formation de l’eau 


2. Lire à ce sujet l’article de E. Hecht « How Einstein confirmed Æo = mc? », American Journal of 


Physics, 79 p. 591-600 (2011). 
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à partir des molécules de dioxygène et de dihydrogène, extrêmement exothermique, 
que nous avons évoquée plus haut, la variation d’énergie interne est de 8,2 x 1071? J, 
donc celle de masse est de 0,9 x 107% kg lorsqu'on fait réagir deux molécules de H> 
avec une molécule de O, soit une variation relative de quelques 3x107 10, Elle a donc 
échappé aux mesures des chimistes. Elle est par contre parfaitement observable dans 
les réactions nucléaires : lors de la réaction de fusion d’un noyau de deutérium avec 
un noyau de tritium qui produit un noyau d’hélium et un neutron libre, la variation 
d'énergie interne est de 2,8 x 107? J, celle de masse est donc de 3 x 1077? kg, soit 
une variation relative de 4 X 107, donc plus grande par sept ordres de grandeur. 


SENcarr 7.5 Expérience de pensée montrant qu’une variation 
d'énergie interne entraine une variation de la masse du système 
composite 


Considérons un système physique € constitué par un corps composite de 
masse M. Son état, et donc son énergie interne, est susceptible de changer lors- 
qu’il absorbe de la lumière. Par exemple, il s’échauffe et sa température change, 
ou bien il change de niveau d'énergie. Nous allons voir que sa masse doit aussi 
changer lors d’un tel changement d'énergie interne. 

Considérons le dispositif de la figure 7.4, où le corps € se trouve à l’origine des 
coordonnées et où deux sources lumineuses S; et $,, situées sur l'axe Oy d’un 
référentiel R en deux points symétriques par rapport à O, émettent au même 
instant deux impulsions lumineuses identiques d'énergie E,,, en direction de O. 
Le corps C absorbe alors simultanément ces deux impulsions et change donc 
d'énergie interne. Pour les besoins de la démonstration, il faut savoir qu’une 
impulsion de lumière d'énergie E,,, transporte aussi une quantité de mouve- 
ment Plum dans la direction de sa propagation et de module bp,» = Elum/C. 

















A 
ia (b) 





Figure 7.4 - Un corps C de masse M absorbe deux impulsions lumineuses venant 
de directions opposées (a) dans le référentiel où sources lumineuses et corps sont 
au repos (b) dans un référentiel où l’observateur a une vitesse -V par rapport 
au corps. 
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Plaçons-nous d’abord dans le référentiel R où le corps et les deux sources lumi- 
neuses sont immobiles. Son énergie interne passe de Ejyr1 à Ejyr2, et sa quantité de 
mouvement de p;, = 0 à p2. Dans ce référentiel, la quantité de mouvement totale 
Pium des deux impulsions se propageant en sens inverse est nulle. La conserva- 
tion de la quantité de mouvement dans cette transformation s’écrit alors : 


P2 = Pium + P1 (7.47) 


donc p2 = 0 : le corps C n’est pas mis en mouvement lors de l’absorption. La 
conservation de l'énergie totale, réduite dans R à la seule énergie interne im- 
plique alors : 

Eint2 = Einti + 2 Ejum (7.48) 


Plaçons-nous maintenant dans un référentiel R’ en mouvement le long de Ox 
de vitesse -V par rapport à R&. Dans ce référentiel, les sources lumineuses et le 
corps C se déplacent à la vitesse V, et à cause du phénomène d’aberration que 
nous avons étudié dans le paragraphe 5.2.2, les deux impulsions se propagent 
selon une direction qui fait un angle a non nul avec l’axe O’y’. Leurs quantités 
de mouvement ne sont donc plus exactement opposées, et leur somme acquiert 
une composante non nulle le long de l’axe Ox. On suppose maintenant que le 
mouvement est extrêmement lent, de sorte qu’on peut utiliser les lois classiques 
de changement de référentiel et l'expression classique de la quantité de mouve- 
ment, qui vaut donc MV pour le corps C dans le référentiel 8’. L’angle « est dans 
ce cas très petit, et égal à V/c (voir section 5.2.2). La conservation de la compo- 
sante selon Ox de la quantité de mouvement lors de l’absorption des impulsions 
s'écrit alors : 


P2x = MV + 2 Pium Sin & = MV + 2Eymlc X V/C = MV + (Enr — Einnr)V/c? (7.49) 


La conservation de la quantité de mouvement dans le référentiel R nous a montré 
que la vitesse du corps C n’est pas changée lors de l’absorption. C’est donc aussi 
vrai dans &’, où elle reste à la valeur V. On est donc tenté d'écrire p, = MV, ce qui 
est incompatible avec (7.49). /] faut donc se résoudre à envisager que la masse 
M varie dans la transformation et passe de la valeur M à la valeur M+AM. (7.49) 
implique donc : 

(M+AM)V = MV + (Eine — Ein) V/c? (7.50) 


D'où finalement : 
AM = (Eint2 — Einti)/C2 (7.51) 


7.3.4 Énergie totale relativiste 


En relativité restreinte comme en mécanique classique, l’énergie totale est définie 


comme la somme des différents types d’énergie : interne, cinétique et potentielle : 


Esotale = Eint + Ecin + E pot (7.52) 
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c’est-à-dire : 
Esotate = Mc? + Mc? (ys — 1) + Epot = YoMC° + Epot (7.53) 


pour un système (composite ou non) de masse M. Dans cette expression, le terme 
E »or fait, par exemple, référence à l’énergie potentielle de gravitation, ou, de façon 
plus générale, à l’énergie potentielle associée à toute force extérieure agissant sur le 
système. 

Il est à noter que, parfois, et bien que cela puisse être source de confusion, on 
introduit la notion de « masse en mouvement », ou « masse relativiste », M’ = y,M, 
l'énergie totale s’écrivant alors M'c? + E pot: 

L'expression de l’énergie totale relativiste est très souvent utilisée sous la forme 
suivante (faisant le lien entre Eyssale et P) : 


2 
(Esotate = Epot) = p’c? — M°c* (7.54) 
puisque pc? = y-M?v?c? = (1 - y2)M?c{. 


Plus simplement, pour un système de masse M non soumis à des forces extérieures, 
on obtient l’importante relation : 





totale — pc” = Mc (7.55) 
qui reste valable pour des particules de masse nulle (comme le photon) pour les- 
quelles E = pc. 


2.3.5 Invariants relativistes et notion de quadrivecteur 


Les quantités M et c ne dépendant pas du référentiel choisi, contrairement aux ex- 
pressions de Eale et p, la relation précédente conduit à l’existence d’une quantité 
invariante par changement de référentiel : 


Le, — p’c? = AE — p’c° = M°?c* = invariant (7.56) 


De la même façon, on a déjà vu (section 3.3.5) que le carré de l’intervalle d’espace- 
temps As? gardait la même valeur quelque soit le référentiel choisi pour exprimer Ax 
et Af. On dit que c, M, As? et E? — pe sont des invariants relativistes. 


Remarque 


Dans le cas de la lumière (ou de façon générale, pour toute particule de masse nulle) 
l’invariant E2 - p?c? est nul. 
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Cette notion d’invariance de valeur, quelque soit le référentiel, peut se généra- 
liser à la notion d’invariance de forme (qu’on appelle la covariance) lorsqu'une 
quantité peut être définie indépendamment du référentiel. Cela en est ainsi, par 
exemple, des vecteurs usuels à trois dimensions qui peuvent être définis indépen- 
damment du système de coordonnées choisi pour exprimer leurs trois composantes. 
Dans l’espace-temps quadri-dimensionnel de la relativité restreinte, on ajoute une 
composante temporelle aux vecteurs spatiaux usuels pour former des guadrivecteurs 
(paragraphe 3.3.4). Ainsi, le quadrivecteur position se lit : (cf,x,y,z). Ces quadrivec- 
teurs forment un espace vectoriel, appelé espace de Minkowski, mais les règles de 
calcul (par exemple celle du produit scalaire) y sont différentes de l’espace vectoriel 
usuel à trois dimensions (encart 7.6). 

Pour qu’il y ait bien covariance, on peut montrer alors que les quatre composantes 
de ces quadrivecteurs doivent obéir aux mêmes transformations de Lorentz que les 
coordonnées d’espace-temps dans un changement de référentiel. Très souvent, les 
relations obtenues permettent de retrouver — presque sans calcul — les effets usuels de 
mécanique relativiste, comme l’effet Doppler ou la loi de composition des vitesses. 


Exemple 


Quadri-vitesse (définie comme la dérivée de la quadriposition (ct,x,y,z) par rap- 
port au temps propre r) : 


(roro) (7.57) 


dont la transformation par changement de référentiel permet de retrouver la loi 
de composition des vitesses. 


En effet, soit un objet ponctuel mobile de vecteur vitesse v dans le référentiel 
galiléen À et de vecteur vitesse v” dans le référentiel galiléen R’ en déplacement 
uniforme par rapport à R à la vitesse V = Ve, suivant l’axe (Ox). Soient aussi y,, yy 
et yy les facteurs de Lorentz associés respectivement aux vitesses v, v’ et V. On passe 
alors des coordonnées (nur YotyrVoue) aux coordonnées (cyr YU Yo 0!) 
par la transformation de Lorentz suivante : 


Ve = Yav(nc - Ep) 
VU = Yav (rotx — Eyrc) 
Yv' U, — VYoly 


1 
YoVz  — Volz 


(7.58) 


dont la première relation y» = yyy (1 — Vo/c?), reportée dans les autres équations, 
redonne bien les formules de composition relativiste des vitesses vues au chapitre 5. 
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Exemple 
Quadri-impulsion (définie comme la quadri-vitesse multipliée par la masse m) : 


bemeymvy,mv,,y,mvi) (7.59) 


Exemple 
Quadrivecteur d'onde : 
(w/c,k,,k,,ke) (7.60) 


dont la transformation par changement de référentiel permet de retrouver les for- 
mules des effets Doppler et d'aberration vues au chapitre 5. 


S(ENcarr 7.6 Espace-temps de Minkowski et tenseur métrique 


L'ensemble des quadrivecteurs forme un espace vectoriel (à 4D) appelé espace 
de Minkowski, où le produit scalaire de l’espace usuel à 3D est remplacé par le 
pseudo-produit scalaire : 





(a,b) = 4obo — 41h; — a>b> - a:b; (7.61) 


La norme usuelle d’un vecteur est alors transformée en une pseudo-norme telle 


que : 
al? = (a,a) = 45 - af - 45 - ai (7.62) 


Exemple 


As? est la pseudo-norme du quadrivecteur (cCAt,Ax,Ay,A2). 


Une pseudo-norme au carré peut être nulle ou négative sans que le quadrivec- 
teur correspondant soit nul (cf, par exemple, la quadri-impulsion d’un photon). 
L’espace-temps de Minkowski n’est donc pas euclidien, comme l’espace habituel 
des positions. 

On peut réécrire cette pseudo-norme (au carré) sous la forme d’une multiplication 


matricielle : 
] CAt 


AS? = (cAt,AX,AY,A2) L. _ se (7.63) 


—] AZ 


D'une façon générale, en termes de composantes, le pseudo-produit scalaire des 
quadrivecteurs a et b s'écrit : 


(a,b) = >, Ga D” (7.64) 
u,v=0,1,2,3 


où g,, est l'élément (4,v) de la matrice diagonale apparaissant dans l'expression 
du ds? ci-dessus. 
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La matrice g, porte le nom de tenseur métrique, et l'ensemble des quatre 
signes (+---) de ses termes diagonaux g. porte le nom de signature de la 
métrique. 


En relativité générale, que l’on abordera au chapitre 9, les facteurs g,, n’ont plus 
une forme aussi simple. 


7.4 COLLISIONS RELATIVISTES 


7.4.1 Méthode générale : lois de conservation 


En mécanique non relativiste, les collisions entre particules se divisent en deux caté- 
gories : élastiques et inélastiques. Dans les collisions élastiques, l’énergie et la quan- 
tité de mouvement totales sont conservées. Dans les collisions inélastiques, seule 
la quantité de mouvement totale est conservée. L'énergie (non relativiste) n’est pas 
conservée, une partie de l’énergie cinétique pouvant se transformer en énergie interne 
(en chaleur par exemple). De même, une partie de l’énergie interne peut se convertir 
en énergie cinétique (comme cela se passe dans une explosion ou lors de la propulsion 
d’un véhicule). 

En mécanique relativiste, du fait que l’énergie interne est incluse dans la définition 
de l’énergie totale, celle-ci est conservée dans les deux types de collisions, élastiques 


et inélastiques : 
D rm = >» ve? (7.65) 
i Î 


avant après 


D Emi] = > Eotale, j (7.66) 
! j 


avant après 


où la somme s’effectue sur l’ensemble des particules présentes, ainsi que les trois 
composantes de la quantité de mouvement totale : 


D rm) = Vimv' (7.67) 
i avant î après 
D ] [Sp (7.68) 
i avant Î après 


Ces quatre relations ainsi que la considération des invariants (7.56) pour chacune 
des particules impliquées dans la collision permettent alors de déterminer les masses 
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et vitesses des particules après la collision en fonction des masses et vitesses des 
particules avant la collision (voir les exemples ci-dessous). 

D'autres quantités sont aussi conservées : la charge totale, par exemple, ainsi que 
d’autres nombres quantiques caractérisant les particules (nombre baryonique, isos- 
pin, saveur...), mais nous ne les détaillerons pas ici. 

Les trois cas de collisions inélastiques relativistes présentées ci-après sont chacun 
représentatifs d’une classe entière de réactions : une fusion de deux particules en une 
seule et son opposé, la désintégration d’une particule en deux particules, et enfin un 
exemple de diffusion de deux particules. 


7.4.2 Fusion de l'hydrogène « 2 particules — 1 particule » 


Sans entrer dans les détails sur la notion de fusion nucléaire, qui sera vue au chapitre 
suivant, nous pouvons examiner un exemple typique de collision relativiste interve- 
nant dans un processus bien connu de fusion nucléaire : celle de l’hydrogène qui se 
produit à l’intérieur des étoiles (tel notre soleil). 

En effet, l’équation bilan de la fusion d’un noyau de deutérium et d’un noyau de 
tritium conduisant à la production d’un noyau d’hélium et d’un neutron est particu- 
lièrement simple (quatre corps seulement) et s’écrit : 


H+H— He+in (7.69) 


Pour donner une idée du calcul, simplifions à l’extrême le traitement de cette col- 
lision inélastique et considérons la réaction de fusion suivante : deux particules de 
même masse se percutent et donnent naissance à une troisième particule. 


l x 
Avant la , Aprèsla 
collision ; collision 
v | v’ 
> ©, 
m m : m’ 
| 





Figure 7.5 - Illustration d’une collision inélastique où deux particules de masse m 
fusionnent pour ne former qu’un seul corps de masse "m. 


Avant la collision, on a donc une masse m au repos et une autre masse m venant 
la percuter à la vitesse v. Après la collision inélastique, on n’a plus qu’une seule 
masse m” allant à la vitesse v’ (selon l’axe défini par la vitesse v, voir la figure 7.5). 
Le problème est donc à une seule dimension d’espace, ce qui simplifie beaucoup les 
calculs. 

Commençons par le calcul de cette collision dans le cadre de la mécanique clas- 
sique. La masse m7’ est alors simplement égale à la somme des deux masses m", et l’on 
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obtient : 


| | 
En PU, et ue Up p puisque m=2m (7.10) 


_ 1 LL}: , 
Evan = 3 MU Eoprès = 5m UV = MU 


La loi de conservation de la quantité de mouvement s’écrit alors mv = 2mv’, d’où : 
v’ = v/2 11 
ce qui, reporté dans l’expression de l’énergie cinétique, conduit à la relation suivante : 


l 2 1 2 
Ein avant — 7 £ Ein après — 17 (7,72) 
traduisant le fait que la collision n’est pas élastique : une partie Q de l’énergie ci- 
nétique (énergie externe) s’est transformée en énergie interne (énergie stockée, par 
exemple pour un corps étendu, sous forme de chaleur, de déformations, de rotation..). 
Il y a bien sûr conservation de l’énergie totale lors de cette collision : 
ls 


Il 
Evant = 57 — E près = ru +Q (7.73) 


où Q est l'énergie d’excitation du système de masse m1” = 2m. 
Passons au calcul relativiste. Les différentes formes de l’énergie (cinétique et in- 
terne) sont contenues alors dans l’expression de E, et l’on a : 


Pavant — YvmL Paprès — Yvm'v 
et ’ 7.74 
Le = (1 +) mc? es — Yvm “a 


Les lois de conservation de la quantité de mouvement et de l’énergie conduisent alors 
respectivement aux deux relations suivantes : 








= et (1+y)m=yym (7.75) 
Yv'm 
d’où l’expression de la vitesse v’ : 
/ Yu 
— 7.16 
1+y . , 


qui est, contrairement au cas classique, supérieure à v/2 puisque y, est supérieur à 1. 
Quant à la masse "”’, elle s’obtient grâce à l’invariant relativiste liant E et p : 


mc =E -pce =(1+) mc - vimv° (7.77) 


c’est-à-dire : 


1+7y, 
m = m A/1 + 2yy + y5 — YSv2/c2? = 2m > 2m (7.78) 
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qui traduit simplement le fait que l’énergie de masse m/c? est constituée de la somme 
des deux énergies de masse mc? ainsi que de l’énergie interne d’excitation Q. 

Cet exemple simple permet de mettre en évidence la propriété fondamentale de 
non-conservation de la masse lors de collisions inélastiques. 


7.4.3 Désintégration du pion 11° 
« 1 particule — 2 particules » 


Un pion /1° peut se désintégrer en deux photons y d'énergies Ej et E> comme in- 
diqué sur le schéma de la figure 7.6. Les directions d'émission de ces photons sont 
notées 6, et 4. Le problème est donc à deux dimensions d’espace. On cherche, par 
exemple, à établir la relation entre la masse m du pion (supposée inconnue) et les 
quatre grandeurs mesurables E1, E, 61 et 6. 


Pi 
Avant Après Fu 
A ec =) CE = 
m 6, 

















Figure 7.6 - Désintégration d’une particule en deux particules : schéma représentant 
les trajectoires. 


Les relations de conservation de l’énergie et de la quantité de mouvement totales 
s’écrivent : 


Po = P1 + P2 (7.79) 
Eo = Ei + E) (7.80) 


où E est l’énergie du pion, et po, P1, p2 les quantités de mouvement des trois parti- 
cules. 
Une façon simple d’éliminer po et Eo de ces deux équations est alors d’utiliser la 
relation fondamentale entre po et Eo : 
me E? — po?c? 
2 2 2 
= (Ei+E) —(p1+pa) c (7.81) 


Comme E\ = pic et E2 = p2c pour les photons, on obtient : 


m°c* = (E; + E>) — [CE cos 01 + E cos 0) + (E; sin 0, — E; sin 0) | 
= 2E,E; (1 — cos 6, cos 6; + sin 0; sin 6) (7.82) 
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Figure 7.7 - Désintégration d’un pion négatif d’une énergie de 16 milliards 
d’électronvolts dans un jet de particules. Cet événement a été enregistré en 1970, avec 
la première chambre à bulles à hydrogène liquide en service au CERN à Genève. Le 
diamètre de cette chambre est de 30 cm. Sur la photo, les traces rectilignes indiquent le 
parcours des particules neutres, tandis que les traces courbes marquent la trajectoire 
de particules chargées en présence d’un champ magnétique. 

(source : CERN : http://cds.cern.ch/record/39474) 


d’où : 
m = V2E;\E> (1 — COS (6, + 6))/c4 (7.83) 


Exemple 


On mesure FE, = E; = 67 MeV dans une expérience où l’on a choisi 4, = 4; = x/2. La 
masse du pion s’en déduit : 


m(n°) = 2E/c = 134MeV/c? (7.84) 


Le pion 7° étant électriquement neutre, il est particulièrement difficile à observer 
expérimentalement (comme dans une chambre à bulles par exemple, figure 7.7). Ce 
sont les photons (ainsi que les paires électrons-positrons) produits lors de sa désinté- 
gration qui permettent de déduire sa présence. 


7.4.4 Désintégration du neutron 
« 1 particule — n particules » 


Le neutron est stable quand il entre dans la composition d’un noyau, mais instable 
quand il est libre. On observe alors qu'il se désintègre au bout d’un temps aléatoire 
dont la durée moyenne est de 900 s et qu'il donne naissance à deux particules : un 
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proton et un électron. L’expérience montre qu’on recueille des électrons dont l’éner- 
gie E, peut prendre toutes les valeurs possibles, supérieures à son énergie au repos 
mc”, où m, est la masse de l’électron. 

Les relations de conservation de l’énergie et de la qualité de mouvement s’écrivent 
dans ce cas, avec des notations évidentes : 


Ey=E,+E, ; Pn = Pp+Pe (7.85) 


Le neutron étant initialement au repos, les quantités de mouvement p, et pe du 
proton et de l’électron sont égales et opposées, et on a en outre E, = m,c°. L'énergie 


E, de l’électron vaut E, = mc + péc?. On a aussi E, = E, — ]m5ct + p5e? = 


Mc? — tee — pie. Nous avons donc deux relations reliant les deux inconnues 


E, et pe. aux quantités fixes et connues m,, m, et m.. La résolution de ce système de 
deux équations va donner en particulier une valeur bien définie, que nous ne calcule- 
rons pas, à l’énergie E,, ce qui contredit les résultats expérimentaux que nous avons 
évoqués au début. 

Ce problème a été l’objet de maintes spéculations dans les débuts de la physique 
nucléaire, certains allant même jusqu’à rejeter les lois de conservation de l’énergie 
et de la quantité de mouvement pour les réactions nucléaires ! C’est W. Pauli qui 
a trouvé la solution en 1930, en faisant l’hypothèse que la désintégration du neutron 
donne naissance non pas à deux particules mais à trois, le proton, l’électron et une hy- 
pothétique particule non détectée dans les expériences. On rajoute ainsi de nouvelles 
relations de conservation qui aboutissent à une énergie variable de l’électron. Cette 
particule a été appelée ultérieurement« neutrino » (« petit neutron ») par E. Fermi. Elle 
joue un rôle très important dans de nombreuses réactions nucléaires. On retrouvera 
en particulier cette particule dans le chapitre 12 (section 12.4.2). 


74,5 Diffusion Compton «2 particules — 2 particules » 


Bien qu’il ait une masse nulle, un photon transporte une énergie et une quantité de 
mouvement non nulles, comme le confirme l’effet Compton que nous allons mainte- 
nant présenter. 

Un photon d’énergie hc/A est diffusé, selon un angle 6, par un électron supposé 
au repos. Après la collision, le photon a l’énergie hc/1’ et l’électron a acquis la vi- 
tesse v, dont la direction fait un angle & par rapport à la direction de propagation du 
photon incident (figure 7.8). Dans l’expérience initiale de Compton, c’est la longueur 
d’onde 1’ de la lumière diffusée qui est mesurée en fonction de l’angle 6. 

La diffusion Compton est un exemple particulièrement instructif de collisions re- 
lativistes mélangeant des particules massives et non-massives. 
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7.4. Collisions relativistes 


Avant Après ou 
\ 


À _7790 
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Figure 7.8 - Diffusion Compton : schéma des trajectoires. 











Avant la collision, la quadri-impulsion totale s’écrit : 


h h 
— + mc,—,0,0 (7.86) 
À À 
et après la collision elle devient : 
h h h . , 
FT + VMC, FT COS Ü + yyMmv COS @, FT sin 0 — y,mv Sin @,0 (7.87) 


avec y, = 1/-V1 — v?/c?. 
La conservation de la quadri-impulsion conduit alors, après quelques lignes de 
calcul, au résultat suivant : 


h 
d'—A=—(1-cos6) (7.88) 
mc 


donnant la variation de la longueur d’onde en fonction de l’angle de diffusion. 

Particulièrement importante en astrophysique, la diffusion Compton inverse est 
une diffusion d’électrons par des photons (du milieu interstellaire par exemple). Par 
rapport au calcul précédent, l’échange des rôles de l’électron et du photon dans la 
collision n’est en rien problématique puisqu’en se plaçant dans le référentiel propre 
de l’électron on retrouve le cas de diffusion directe étudié ici. 
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ET NOTIONS 
DE RADIOACTIVITÉ 


Le chapitre précédent a mis en évidence un lien fondamental entre masse et énergie : 
une variation ÂE de l’énergie interne d’un système se traduit par une variation AM 
de la masse de ce même système : 


AE = AM.c° (8.1) 


Cette équivalence est l’un des points centraux de la physique des noyaux atomiques, 
appelée physique nucléaire, qui regroupe l’étude de la structure et de la stabilité des 
noyaux et celle des réactions nucléaires (naturelles ou artificielles), les rayonnements 
émis (c’est-à-dire la radioactivité) et leurs effets sur les milieux biologiques (c’est-à- 
dire la dosimétrie). 

Les applications de la physique nucléaire sont extrêmement nombreuses et quo- 
tidiennes : énergie et armes nucléaires, techniques d’imagerie et de traitement en 
médecine nucléaire, datation isotopique en géologie et archéologie. 


8.1 STRUCTURE DES NOYAUX ATOMIQUES, 
ÉNERGIE DE LIAISON 


8.1.1 Rappels sur les constituants d’un noyau atomique 


La matière est constituée de molécules, c’est-à-dire de groupements d’atomes qui 
s’associent au moyen de liaisons (covalentes, ioniques, hydrogène...). On connaît, 
en 2015, 118 types d’atomes différents, allant de l’hydrogène 1H (le plus léger) à 
l’ununoctium cu Uuo (le plus lourd), et plusieurs autres éléments sont en passe d’être 
synthétisés dans des accélérateurs de particules (français, allemands, russes, améri- 
cains...). 

Bien que le mot atome (qui dérive du grec ancien atomos) signifie insécable, les 
atomes ne peuvent pas être considérés comme des constituants élémentaires indes- 
tructibles de la matière. Ils sont formés d’un noyau central très dense, entouré d’élec- 
trons. La taille typique du noyau est de quelques femtomètres (1 fm = 107!° m), 
très inférieure à la distance moyenne électron-noyau qui est de l’ordre de quelques 
angstrôms (1 À = 10710 m). Les noyaux atomiques sont eux-mêmes constitués de 
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protons et de neutrons, qui sont les deux formes possibles d’une autre particule appe- 
lée nucléon. Les nucléons sont également sous-structurés, sous forme d’assemblages 
de quarks que nous aborderons au prochain chapitre. 


Les masses du proton et du neutron sont très proches : 
my © 1,672622.10 77 kg 
mn = 1,674927.107?7 kg 


contrairement à leurs charges électriques qui sont très différentes : le neutron n’a 
pas de charge électrique (d’où son nom) alors que le proton a une charge électrique 
positive, égale à l’inverse de la charge d’un électron. 


(8.2) 


4 =+e=1,602177.107/° C (8.3) 
a =0C (8.4) 


Les protons ayant la même charge électrique, ils ont tendance à se repousser du 
fait de l’interaction coulombienne. Cependant, à l’échelle du noyau, celle-ci est bien 
moins intense que l'interaction forte qui attire mutuellement les nucléons et assure 
la stabilité des noyaux atomiques. L’interaction forte sera brièvement décrite au pro- 
chain chapitre. 

Les atomes étant électriquement neutres, ils possèdent le même nombre de protons 
que d’électrons. Ce nombre est noté Z : c’est à la fois le nombre de charge du noyau et 
le numéro atomique de l’élément considéré. Le nombre total de nucléons d’un noyau 
est quant à lui appelé nombre de masse, et il est noté À. 

On représente alors un atome sous la forme 2X , où À et Z sont les nombres de 
masse et de charge du noyau de l’élément dont le symbole chimique est « X ». On 
emploie aussi le terme nucléide pour désigner un élément, ou un noyau, défini par un 
couple (A,2). 

Citons comme exemples, l’élément le plus léger, l'hydrogène dei : 1 nucléon 
(1 proton, 0 neutron) et 1 électron ; et l’élément le plus lourd, l’ununoctium se Uuo : 
294 nucléons (118 protons, 176 neutrons) et 118 électrons. 

Il est à noter que, lorsque l’on connaît bien la signification des symboles chi- 
miques, on peut se contenter d’écrire X puisque l'information «Z » est déjà contenue 
dans le symbole chimique de l’élément, reflétant son nombre d’électrons, et donc de 
protons. 

Deux éléments ayant le même nombre de charge Z mais différant par leur nombre 
de masse sont appelés des isotopes. 

Par exemple, parmi les 15 isotopes connus du carbone (allant de $C à ??C), les 
deux plus abondants naturellement sont le carbone-12 (à 98,93 %) et le carbone- 
13 (à 1,07 %), des traces de carbone-14 étant également présentes dans la matière 
environnante. 
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8.1. Structure des noyaux atomiques, énergie de liaison 


Bien qu'ayant des propriétés chimiques et biologiques semblables, puisqu'ils ont 
le même nombre d’électrons dans leur nuage électronique, deux isotopes peuvent 
avoir des propriétés physiques très différentes (en particulier, la façon dont leur noyau 
se désintègre). Cette différence dans le mode de désintégration est le point de départ 
de la méthode de datation nucléaire (datation au carbone-14 par exemple). 

Il existe actuellement des milliers d’isotopes des 118 éléments découverts à ce 
jour. 

Les masses atomiques étant de l’ordre de 10777 kg, une unité de masse plus ap- 
propriée a été introduite : l’unité de masse atomique, définie aujourd’hui comme un 
douzième de la masse d’un atome de carbone-12 : 


_ 12, 37 
lu = "(6 C) = 1,66054.107 77 kg (8.5) 


qui correspond à l’énergie de masse suivante (en eV) : 
lu.c° = 931,5 MeV (8.6) 


La définition du nombre d’Avogadro Na est également basée sur l’élément carbone : 
c’est le nombre d’atomes contenus dans 12 g de carbone-12, c’est-à-dire : 


12:10 
__ 1,992647.10-26 


Comme énoncé plus haut, la masse d’un atome est très proche de la somme des 
masses de ses nucléons : 


a = 6,02214.107 (8.7) 


m(£X) = Zmp + (A —Z)mn © Au (8.8) 


(et dans le cas du carbone-12, ces deux masses sont rigoureusement égales par défi- 
nition de u). Cette approximation n’est cependant pas valable lorsque l’on s’intéresse 
aux énergies de liaison nucléaires. 


8.1.2 Défaut de masse, énergie de liaison 


Expérimentalement, on constate que la somme des masses des constituants d’un 
atome est toujours supérieure à la masse de cet atome : il existe donc un défaut de 
masse Am défini par la relation : 


Am(2X) = [Zm, + (4 -Z)m]-m(2x) (8.9) 


Par exemple, pour le carbone-12, on obtient la valeur suivante pour son défaut de 
masse : 


Am (?C) = 6m + 6m - m(?C) (8.10) 
= 1,59.107 kg + 8.107* x m{1°C) (8.11) 
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La relation d’Einstein AE = AM.c°, détaillée dans le paragraphe 7.3.3 du cha- 
pitre précédent, nous indique alors qu’à cette variation de masse Am (2x) peut être 
associée une variation d’énergie interne, notée conventionnellement B (A,2) : 


B(A,Z) = Am(?X) .c° (8.12) 


et appelée énergie de liaison du noyau. 


L'énergie de liaison B (A,Z) est en fait la différence entre l’énergie de masse des 
constituants du noyau séparés et éloignés les uns des autres à l’infini et l’énergie de 
masse de ces mêmes constituants lorsqu'ils sont liés entre eux au sein du noyau. Cette 
énergie potentielle de formation est donc également l’énergie qu’il faut fournir à un 
noyau pour le dissocier en ses constituants élémentaires, c’est-à-dire en neutrons et 
protons. 


Par exemple, l’énergie de liaison d’un noyau de carbone-12 vaut : 
Ejiaison (°C) = B(12,6) = 1,48.107/7 J = 92,16 MeV 


L'énergie de liaison nucléaire B (A,2) ne doit pas être confondue avec l’énergie de 
liaison atomique, ou énergie d’ionisation, Ej, qui correspond à l’énergie à fournir à 
un atome pour lui arracher un (ou des) électron(s). 

Pour rendre compte de la stabilité des noyaux, on utilise en fait plutôt l’énergie de 
liaison par nucléon B/A qui traduit l’énergie moyenne qu’il faut fournir à un noyau 
pour lui arracher un nucléon. Ainsi, selon cette approche (qualifiée de modèle de la 
goutte liquide), plus B/A est important, plus le noyau correspondant est stable. 


Il existe actuellement 80 éléments qui ont au moins un isotope stable, et 1l y a en 
tout 254 nucléides ZX stables connus. 


Un noyau est dit instable si son assemblage de nucléons ne perdure pas dans le 
temps (du moins à l’échelle de l’âge de l’Univers). Cette modification, appelée dés- 
intégration radioactive, est aléatoire mais peut être caractérisée par une durée de vie 
moyenne (section 8.3). Il existe plusieurs milliers de nucléides instables dont les du- 
rées de vie s’étalent sur près de 30 ordres de grandeurs, de quelques fractions de 
seconde à quelques milliards d’années. 


La désintégration radioactive d’un noyau peut prendre plusieurs formes : division 
en plusieurs noyaux plus légers (fission, réaction @), transformation d’un neutron en 
proton (réactions BB)... Pour les noyaux légers comme ceux des isotopes de l’hydro- 
gène, il peut y avoir des réactions de fusion conduisant à la création d’un noyau plus 
lourd avec dégagement d’une grande quantité d’énergie. 
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8.2. De multiples réactions nucléaires 


8.2 DE MULTIPLES RÉACTIONS NUCLÉAIRES 


8.2.1 Lois de conservation, énergie de réaction 


Une réaction nucléaire est un processus au cours duquel un ou plusieurs noyaux ato- 
miques subissent une transformation, c’est-à-dire un changement de structure. Il peut 
s’agir d’une collision inélastique entre deux corps (entre deux noyaux, par exemple, 
ou entre un noyau et une particule : électron, neutron, proton...) ou d’une désinté- 
gration radioactive (dans ce cas, un seul noyau, appelé noyau père, donne naissance 
à un ou plusieurs noyaux fils). Dans tous les cas, 1l y a transformation de masse en 
énergie : la relation d’Einstein AE = AM.c? est à la base de toute réaction nucléaire. 

On distingue généralement trois étapes distinctes lors d’une réaction nucléaire : 
avant, pendant et après la réaction. Avant et après la réaction, les corps concernés 
(noyaux et particules) sont supposés être assez éloignés les uns des autres pour qu’il 
n’y ait plus aucune interaction entre eux. L’interaction n’est supposée avoir lieu que 
pendant un bref moment, que nous ne détaillerons pas. 

Nous nous concentrons plutôt sur les divers types de réactions possibles et sur les 
relations qui existent entre les réactifs (les corps avant la réaction) et les produits (les 
corps après la réaction). Ces relations découlent principalement des quatre lois de 
conservation suivantes, les deux premières ayant déjà été étudiées dans le chapitre 
précédent : 


1. conservation de la quantité de mouvement totale : 


> Préactifs — 7 Produits (8.13) 


2. conservation de l’énergie totale : 


>» Eéactifs >. E produits (8.14) 


3. conservation du nombre de masse total : 


>» Aéactifs = >, À produits (8.15) 


4. conservation du nombre de charge total : 


>. Zréactifs : >} Zproduits (8.16) 


Il existe également d’autres lois de conservation (qui ne seront pas détaillées dans ce 
cours), comme celle du moment cinétique par exemple, ou celles d’autres nombres 
caractéristiques du noyau comme les nombres leptonique, baryonique ou d’isospin. 
Les réactions nucléaires peuvent se mettre sous une forme similaire aux réactions 
chimiques : 
ZX +22 — PX3+2Xa (+0) (8.17) 
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où X, et X2 sont les réactifs et X3 et X4 (et Xs, X6... si besoin) les produits de la 
réaction. La quantité Q est l’énergie (de masse) de la réaction. 

Les lois de conservation des nombres de masse et de charge conduisent alors aux 
relations : 


A1 + A2 = A3 + A4 (8.18) 
Zi +2 = Z3 + Z4 (8.19) 


ce qui permet d’équilibrer les réactions lorsque certains nombres À; ou Z; sont incon- 
nus. 

L'énergie (de masse) Q de la réaction est par définition égale à l’énergie de masse 
libérée par la réaction : 


Q = 52 Myéactifs — > M produits) e (8.20) 


où ( Mréactifs — Dim raie) est le défaut de masse de la réaction. 
Pour la réaction 8.17, Q s'écrit : 


Q=[m(x1)+m(22X2) - m(2X3) - m(23X4)| .c? (8.21) 
qu’on peut également exprimer en fonction des énergies de liaison respectives : 
Q = B(A3,Z3) + B (44,24) — B(A1,21) — B (42,2) (8.22) 


en prenant garde à l’ordre des termes. 
Du fait de la conservation de l’énergie totale (somme de l’énergie de masse mc? et 
de l’énergie cinétique E, = (y — 1) mc?) : 


2 2 
», (méacripse " Ecréactifs) — >», (M produits + Fate) (8.23) 


on montre facilement que Q est aussi égale à la variation d’énergie cinétique de la 
réaction : 
Q = Ec(X3) + Ec(X4) — Ec (X1) — Ec (X2) (8.24) 


Lorsque Q est positive, 1l y a donc transformation d’une partie de la masse totale 
initiale en énergie cinétique des noyaux et particules produits. On dit que la réaction 
est exoénergétique. Elle est alors spontanée et il y a un gain d’énergie de liaison 
(totale) lors de la réaction. 

Lorsque © est négative, la réaction est dite endoénergétique. Dans ce cas, une 
partie de l’énergie cinétique totale initiale se transforme en énergie de masse des 
produits. Une telle réaction ne peut donc se produire que s1 les réactifs (X, et X2) ont 
une énergie cinétique relative suffisamment importante (collision avec des particules 
rapides par exemple). 
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8.2. De multiples réactions nucléaires 


Il est à remarquer que, dans le cas où l’un des noyaux (réactifs ou produits) est 
dans un éfat excité, avec une énergie interne supplémentaire E”, 1l faut prendre en 


compte cette énergie dans l’expression de Q. Par exemple, un noyau excité : X; peut 


se désexciter sous la forme : X} — À X, (+0) en émettant un photon d’énergie 
Q = E* = hv. D'une façon générale, l’énergie libérée par une réaction nucléaire se 
retrouve sous trois formes : énergie cinétique des corps massifs produits, énergie Av 
des photons émis, énergie interne d’excitation. 


8.2.2 Réactions a, Bet y 


Réaction a. Certains noyaux instables se désintègrent en émettant un noyau 
d’hélium-4 He, aussi appelé particule à : 


XX Y+ He (8.25) 
Par exemple, la désintégration radioactive de l’uranium-238 : 
SOU — S Th+5He (+Q = 4,27 MeV) (8.26) 


est responsable d’une part importante de la production naturelle d’hélium sur Terre. 

Les particules & produites dans de telles réactions ont une énergie cinétique de 
l’ordre de 5 MeV, c’est-à-dire une vitesse de l’ordre de 5 % de c, ce qui implique 
d'utiliser la relativité restreinte pour rendre compte de leur mouvement. 

Du fait de leur masse (m (He) = 4,0026 u) et de leur charge (+2 e) relativement 
importantes, les particules & interagissent facilement avec les atomes environnants 
et perdent rapidement leur énergie, même lorsqu'ils se propagent dans l’air ambiant. 
Quelques centimètres d’air suffisent alors à les arrêter. 

Comme applications principales de la radioactivité «, citons les détecteurs de 
fumée par ionisation! et les microgénérateurs d’énergie (pour les satellites par 
exemple). Un exemple de microgénérateur d’énergie utilisant la radioactivité & est 
représenté sur la figure 8.1. 

Réactions B. Un noyau peut être instable parce qu’il est trop riche en neutrons. Un 
de ses neutrons peut alors se transformer spontanément en proton suivant la réaction : 


pit er (8.27) 


où v, est une particule neutre, très légère, appelée antineutrino électronique. 


1. Dans ce type de détecteur, un matériau radioactif émetteur de particules & ionise l’air entre deux 
électrodes, créant ainsi un courant électrique mesurable. Lorsque des particules de fumée pénètrent dans 
le détecteur, elles absorbent une partie des particules &, induisant une baisse du courant qui déclenche 
l’alarme. Du fait de la nocivité des produits radioactifs utilisés, ces détecteurs sont désormais interdits 
en France. 
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Figure 8.1- Photo du microgénérateur d'énergie à radioactivité « utilisé dans la sonde 
spatiale Cassini. 
(source libre : http://en.wikipedia.org/wiki/Cassini-Huygens) 


La désintégration B° d’un noyau ;X s'écrit donc : 
0 — 


/ B L , 
Es — Re À +0. € +pVe (8.28) 


où la particule F7 n’est rien d’autre que l’électron produit lors de la transformation 
d’un neutron en proton. 


Par exemple : 


Sr DY+,e +0 (+0,546 MeV) (8.29) 
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8.2. De multiples réactions nucléaires 


Les particules 8” étant chargées, elles interagissent assez fortement avec la matière 
qu’elles traversent (mais moins que les particules @). Quelques millimètres d’alumi- 
nium suffisent à les arrêter. Elles sont généralement ultra-relativistes. 

Les applications principales de la radioactivité B” concernent le traitement de cer- 
tains cancers des yeux et des os, ainsi que certains tests de qualité dans la fabrication 
du papier. 

Un noyau peut également être instable parce qu’il contient trop de protons. Il y a 
conversion d’un des protons du noyau en 1 neutron, 1 positron et 1 neutrino électro- 
nique : 

x E, du +et+0v (8.30) 
Les positrons e* possédent les mêmes propriétés physiques que l’électron excepté la 
charge qui est opposée. 

Par exemple : 


Na — Ne +0e*+5ve (+2,842 MeV) (8.31) 


La tomographie par émission de positrons (PET) est l’une des applications mé- 
dicales principales de la radioactivité B*. Elle consiste à réaliser une image à trois 
dimensions d’un organe où l’on a préalablement fixé des noyaux radioactifs « tra- 
ceurs », émetteurs de positrons. On ne détecte en fait pas directement les positrons, 
mais les rayons y émis lors de la désintégration des positrons. 

Réaction y. Chaque désintégration & ou B d’un noyau instable donne générale- 
ment naissance à un noyau fils dans un éfat excité métastable. Celui-ci peut alors se 
désexciter en émettant un ou plusieurs photons y : 


2 x (0) (8.32) 


où l’énergie libérée Q est l’énergie d’excitation E* du noyau initial. Celle-ci se par- 
tage en énergie cinétique du noyau désexcité 2x et en énergie Av du photon y émis. 
Un calcul rapide (conservation de l’énergie et de la quantité de mouvement totales) 
montre alors que : 
I — 
hu = E 25 (8.33) 
1 + UE 
dans le référentiel où le noyau initial À est au repos. Le photon emporte donc 
quasiment toute l’énergie libérée E£” si celle-ci est suffisamment faible par rapport à 
l'énergie de masse Mc?, où M est la masse du noyau X. 
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Exemple 


Émission de deux photons gamma lors de la désintégration d’un noyau de Cobalt 
en un noyau de Nickel : 


SCo— SNi+e +ve+y (+Q) (8.34) 
SN — SNity (+@) (8.35) 


avec Q = 1,17 MeV'et Q: = 1,33 MeV. 


S1 l’énergie du photon émis est assez faible (< 100 keV), 1l peut être converti en un 
électron par effet photoélectrique au sein même de l’atome (on reviendra sur l’effet 
photoélectrique dans la seconde partie de cet ouvrage). Le transfert d’énergie peut 
également être direct (sans faire appel à une réaction y) et conduit à l’émission d’un 
électron de conversion interne. 

Les rayons y sont, comme les neutrons rapides, très pénétrants et 1l faut générale- 
ment plusieurs centimètres de plomb pour les arrêter. 


8.2.3 Fission, fusion 


Fission. Les noyaux très lourds peuvent spontanément, ou artificiellement, se scinder 
en plusieurs noyaux dont l’énergie de liaison par nucléon est plus élevée (c’est-à-dire 
qu’ils sont plus stables). Par exemple, les réactions @ sont un cas particulier de fission 
« naturelle ». On peut aussi provoquer la fission d’un noyau en le percutant avec des 
particules de haute énergie, des neutrons par exemple. 

Certains noyaux très lourds ont aussi la particularité d'émettre et d’absorber fa- 
cilement des neutrons, ce qui peut conduire, si certaines conditions sont vérifiées, 
à des réactions en chaîne. Ces réactions donnent lieu à une libération considérable 
d'énergie. 


Exemple 


235U+n— "4 Ba+%? Kr+2n (+Q) (8.36) 


avec Q = 192,9 MeV. Chaque neutron produit peut alors initier une autre réaction 
de fission, donnant ainsi naissance à une réaction en chaîne du type : 


n— 2n (+Q)— 4n (+2Q) — 8n (+4Q) — … (8.37) 


Remarques 


1. Il faut généralement que les neutrons initiaux aient une énergie cinétique su- 
périeure à une valeur seuil (5,3 MeV dans le cas de l’uranium-235); 


2. La réaction en chaine ne se réalise que si les neutrons produits rencontrent 
suffisamment de noyaux d'uranium sur leur parcours. Il y a donc une masse 
critique d’uranium-235 pour que la réaction se produise (quelques dizaines de 
kg en pratique). 
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En dehors de la réalisation d'armes nucléaires, la production industrielle d'énergie 
nucléaire est aujourd’hui la principale application des réactions en chaîne de fission 
nucléaire. Environ 12 % de l’énergie produite en 2013 dans le monde était d’origine 
nucléaire. Ce chiffre monte à 75 % en France. 


La fission complète de 1 kg d’uranium 235 libère une énergie de 7,9.10!3 J, à 
comparer aux 4,5.107 J libérés par la combustion totale de 1 kg de pétrole. Cette dif- 
férence de concentration d'énergie (nucléaire ou chimique) explique en partie pour- 
quoi il ne faut qu’une trentaine de tonnes d’uranium enrichi pour produire 1000 MW 
d'énergie électrique par an alors qu’il faut 1,5 millions de tonnes de pétrole ou 
2,3 millions de tonnes de charbon. 

Fusion. Deux noyaux légers peuvent, dans certains cas, se rapprocher suffisam- 
ment pour que l’attraction due à l’interaction forte entre nucléons dépasse la répul- 
sion coulombienne des protons. Il en résulte un noyau plus lourd et plus stable. Le 
processus est fortement exoénergétique mais nécessite des conditions de température 
et de pression extrêmement sévères. 

Ces conditions sont remplies au cœur des étoiles où se produisent des réactions de 
fusion de l'hydrogène en hélium 3 et 4 : 


ptp—fH+et+v (8.38) 
‘H+p—5 He+y (production d’hélium 3) (8.39) 
He +5 He —; He+2p (production d’hélium 4) (8.40) 


dont l’équation bilan est finalement : 
4p — He+2e*+.…. (+25 MeV) (8.41) 


La recherche d’une fusion contrôlée de l'hydrogène est actuellement très active 
(projet mondial ITER de fusion par confinement magnétique, projets américains et 
français NIF et LM] utilisant des lasers produisant des impulsions de très grande 
énergie). Une maîtrise industrielle de ce type de fusion permettrait en effet de réaliser 
des centrales fournissant beaucoup plus d’énergie que les centrales utilisant la fission 
d’atomes (10 fois plus environ), et créant beaucoup moins de déchets radioactifs. 


8.3 RADIOACTIVITÉ ET DOSIMÉTRIE 


8.3.1 Loi de décroissance exponentielle 


La probabilité par unité de temps qu’un noyau instable se désintègre se révèle être 
une constante, appelée constante radioactive À (unité : sl). L’inverse de 1 est appelée 
constante de temps de la désintégration, et est notée 7 = 1/1. 
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Centrale nucléaire 


Réacteur à Eau Pressurisée (REP) Nuage de vapeur 


Circuit primaire 


Fleuve ou mer 





Figure 8.2 - Schéma de principe d’une centrale nucléaire produisant de d'électricité. Ce 
réacteur est de type à eau pressurisée (REP). L'eau du circuit primaire est sous haute 
pression (150 bars environ). Elle est utilisée comme fluide caloporteur pour la 
vaporisation de l’eau du circuit secondaire, permettant de créer de l’électricité à l’aide 
de turbines et de transformateurs. L'eau primaire est également utilisée comme 
modérateur pour réfrigérer le cœur du réacteur. Le refroidissement entraîne alors la 
création d'importants nuages de vapeur. Les REP sont les plus répandus des réacteurs. 
(source libre : http://fr.wikipedia.org/wiki/Centrale_nucleaire) 


Le caractère probabiliste du processus fait que l’on ne peut pas connaître l’ins- 
tant où un noyau donné va se désintégrer (cette propriété est d’origine quantique 
comme on le verra dans la seconde partie de cet ouvrage). En revanche, on peut sta- 
tistiquement prédire le comportement d’un grand nombre de noyaux radioactifs. Par 
exemple, sur l’histogramme de la figure 8.3, on a représenté le nombre de désintégra- 
tions radioactives d’un ensemble initial de No noyaux entre deux instants successifs 
séparés d’une durée 7. La probabilité de désintégration entre les instants f et 1 +7T 
étant égale à A7, la courbe approchant l’histogramme est une courbe exponentielle- 
ment décroissante. 

En effet, soit N (r) le nombre de noyaux radioactifs, la loi des grands nombres nous 
indique que la variation dN (r) de noyaux radioactifs pendant le temps dt s’écrit : 


aN (t) = -AN (ft) dt (8.42) 
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courbe obtenue pour 
T0 et N,—00 
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0 7T 2T 37 47 tt 


Figure 8.3 - Statistique des instants de désintégration de noyaux radioactifs. 


qui s’intègre en : 
N (6) = Noe”" (8.43) 


où M, est le nombre de noyaux radioactifs à l’instant initial £ = 0. Cette loi de dé- 
croissance exponentielle porte le nom de loi de Soddy. 

Pour caractériser cette décroissance radioactive on utilise le temps de demi-vie T, 
appelé aussi période radioactive, qui est défini comme le temps au bout duquel le 
nombre de noyaux initialement présents a été divisé par deux : 





N (T) = No/2 (8.44) 

ce qui conduit aux relations : 
In (2 
FA Ho (8.45) 
ét: 
No 

N (f) = ST (8.46) 

Remarques 


l. Elimination biologique : Après avoir été ingérés ou inhalés, les éléments (radio- 
actifs ou non) sont progressivement éliminés par les corps biologiques. Cette 
décroissance est également exponentielle, avec une constante de temps biolo- 
gique +, longue et différente de 7. Pendant le temps dt, les deux types d’élimi- 
nation des éléments radioactifs s'ajoutent : 


ao = -NOdt _ N (t) dt 
T Th 
conduisant à la loi de décroissance exponentielle suivante : 
N(t) = Noe ‘ef (8.48) 
avec la constante de temps effective : 
ri. (8.49) 
Teff — = Th . 
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2. Ce type de décroissance multiple se retrouve également dans le cas où un élé- 
ment radioactif peut se désintégrer de plusieurs façons différentes. Si chaque 
processus a une constante de temps r;, la constante de temps effective sera 
égale à reg = 1/(7; 1/ri). L’inverse de chaque constante de temps étant égale 
à la probabilité par unité de temps du processus correspondant (constantes 
radioactives 4;), les rapports 4/4 = rTeg/ri de ces probabilités sont appelés 


rapports de branchement. Leur somme vaut bien évidemment 1. 


8.3.2 Activité d’une source radioactive 


L'activité d’une source radioactive est, par définition, le nombre de désintégrations 
par unité de temps de cette source : 


A0 


_ _ —{T 
At) = AN (0.= Ave" = GT 


(8.50) 


avec Ao = AN. 


Si une source contient plusieurs éléments radioactifs, l’activité de cette source est 


la somme des activités de ses constituants. 


L'unité est le Becquerel (Bq), qui correspond à une désintégration par seconde. 


D'autres unités sont parfois utilisées, comme le Curie (Ci) qui correspond à 37 GBq. 
Très souvent, on utilise les activités massiques (en Bq.kg |). 
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Exemples 
lait = 80 Bq.kg ! 
un ètre humain de 70 kg = 10“ Bq 


le combustible d'un réacteur nucléaire = 10'° Bq 


=. 
XENcarr 8.1 Dose radioactive : effets de la radioactivité 


Les particules émises («, ñ, p, e”, e*, y...) lors des réactions nucléaires pouvant 
ioniser la matière qu’elles traversent, elles sont couramment dénommées rayon- 
nements ionisants. On définit la dose reçue (ou dose absorbée) « D > comme 
l'énergie déposée dans une unité de masse de matière. L’unité est le Gray : 
1Gy=1)J).kg"! 

L'activité et la dose reçue sont des grandeurs objectives, c'est-à-dire pouvant être 
mesurées avec des appareils (compteur Geiger, calorimètre...). Elles ne donnent 
que peu d'indications sur les effets biologiques produits lors de l’absorption de 
rayonnements ionisants. Ces effets peuvent aller de l’altération à la destruction 
des cellules du vivant. L’altération du patrimoine génétique (l'ADN) d’une cellule 
conduit parfois, lorsque le gène altéré est dominant, à l’apparition de cancers. 


La nature des rayonnements ionisants est particulièrement importante : à dose 
reçue égale, les dégâts sont bien plus importants dans le cas d’une exposition 
à des particules massives (particules alpha, neutrons...) plutôt qu'avec des parti- 
cules peu ou non massives (électrons, positrons, rayons gamma...). On introduit 
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alors un facteur de pondération radiologique W8k pour chaque type de radiation : 
1 pour les rayons X et gamma; 1 pour les électrons et positrons; 5 pour les 
protons; de 5 à 20 pour les neutrons en fonction de leur énergie; 20 pour les 
particules alpha et les noyaux lourds. La dose équivalente « H » est alors définie 
comme la somme des doses reçues D8 pondérées par les facteurs W£& correspon- 
dant aux types de rayonnements ionisants considérés : 


H = » WeDe (8.51) 
R 


L'unité est le Sievert (SV) : 1 Sv=J.kg”! 
Exemples 


Vol Paris-New-York? = 0,02 mSv; radiographie des poumons = 0,3 mSv; radio- 
activité naturelle du sol en France = de 1 à 2 mSv/an; scanner du corps entier 
— 150 mSv. 


L'effet de cette dose équivalente n’est pas le même suivant l'organe touché. 
Pour rendre compte des effets différents selon la nature des tissus biologiques 
irradiés, on introduit un facteur de pondération tissulaire Wr (par exemple, 
Westomac = Wprostate = 0,12; Wioie = Winyroïde = 0,05; Wyeau = Wos = 0,03). La dose 
efficace « Eh » est alors la somme pondérée des doses équivalentes Hr reçues 
par tous les organes et tissus irradiés d’un corps biologique : 


Ep = S. WrHr (8.52) 


= 
= > » Wr WRDer (8.53) 
TON R 


où Der est la dose de rayonnement ionisant R absorbée par le tissu T. L’unité est 
le Sv. 


Remarque 


On utilise souvent les débits de dose (absorbée, équivalente, efficace), c’est-à-dire 
des doses par unité de temps. En France, les limites fixées par la réglementation 
sont actuellement de 20 mSv/an pour les travailleurs du nucléaire et de 1 mSv/an 
pour le reste de la population. 


Les effets des rayonnements ionisants sont de deux types : déterministes 
(brûlures, syndrome d'irradiation aigüe) ou stochastiques (développement aléa- 
toire de cancers). Si les effets dus aux fortes irradiations sont relativement bien 
compris, les effets stochastiques dus aux faibles irradiations sont encore très 
mal connus et sont régulièrement réévalués. On estime que l'excès de cancers 
dûs à la radioactivité est de l’ordre de 5 % par Sv absorbé. Pour se prémunir des 
irradiations, on peut s'éloigner des sources radioactives (division des doses par 


2. S’élever en altitude diminue l’épaisseur de la couche d’atmosphère protectrice qui absorbe les rayon- 
nements ionisants issus du soleil et, plus généralement, de l’espace. 
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un facteur d° si l’on multiplie la distance à la source par d) et/ou utiliser des 
écrans protecteurs dont l’épaisseur est adaptée au type de rayonnement ionisant. 
La loi d'absorption de ces rayonnements est en effet exponentiellement décrois- 
sante dans la matière : 

1O)= Der (8.54) 


où J est l’intensité du rayonnement, x l’épaisseur de matière traversée, et u le co- 
efficient d’absorption linéique du matériau pour le rayonnement ionisant consi- 
déré. Ainsi, par exemple, pour réduire de moitié l’intensité de rayonnements y, 
il faut typiquement : 1 cm de plomb ; ou 2,5 cm d’acier ; ou 6 cm de béton ; ou 
18 cm d’eau ; ou 29 cm de bois ; ou 150 m d’air... 
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LES QUATRE 
INTERACTIONS 
FONDAMENTALES, 
LA RELATIVITÉ 
GÉNÉRALE 


La cohésion de la matière et les interactions entre particules élémentaires sont as- 
surées par diverses forces, qui, selon la conception actuelle de la physique, peuvent 
être décrites au moyen de quatre interactions fondamentales seulement : ce sont la 
gravitation, l’électromagnétisme, et les interactions faible et forte. Ces quatre forces 
fondamentales sont très différentes, tant par leur intensité que par leur portée ou par 
la nature des charges concernées. 





Bien que la recherche d’une description unifiée des interactions fondamentales soit 
l’un des objectifs majeurs de la recherche en physique, la gravitation reste aujourd’hui 
encore à part, et seules les interactions électromagnétique, faible et forte sont pour 
l'instant unifiées au sein d’un modèle théorique appelé modèle standard. 

Le but de ce chapitre est d’introduire plusieurs de ces notions, en insistant plus 
particulièrement sur la théorie de la relativité générale, prolongement naturel des 
idées et principes de la théorie de la relativité restreinte. 


9,1 INTERACTION GRAVITATIONNELLE 
ET NOTION DE RELATIVITÉ GÉNÉRALE 


Dans les chapitres précédents, nous avons vu que, dans le cadre de la théorie de la 
relativité restreinte, les équations de la dynamique et de l’électromagnétisme satisfai- 
saient aux mêmes lois (de transformation de Lorentz). On peut alors se demander s’il 
en est de même des trois autres interactions fondamentales, à commencer par la plus 
commune de toutes à notre échelle : l’interaction gravitationnelle. 

Il est cependant facile de montrer que les équations de la théorie classique de la 
gravitation, c’est-à-dire celle de Newton, ne sont pas en accord avec les transforma- 
tions de Lorentz et le principe de relativité. En effet, en gravitation newtonienne, le 
champ de gravitation créé par une masse s’adapte instantanément dans tout l’espace 
à toute modification de cette masse ou de son mouvement, violant ainsi le principe 
de relativité et le fait qu'aucun objet ou information ne peut se déplacer plus vite 
que la vitesse de la lumière. Il est par ailleurs évident, au simple vu de la formule de 
la force gravitationnelle entre deux masses rappelée ci-dessous (équation 9.1), que 
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toute loi de ce type (ne faisant intervenir que la distance entre les objets) ne peut pas 
être invariante par transformation de Lorentz. Il en est par exemple de même des lois 
de l’électrostatique et de la magnétostatique qui ne tiennent pas compte du temps re- 
quis pour la propagation d’une modification de la distribution des charges ou de leurs 
vitesses. 


Par souci de cohérence, il apparaît donc nécessaire de construire une théorie relati- 
viste de la gravitation, qui serait l’analogue pour la gravité des équations de Maxwell 
pour l’électromagnétisme. 


Une telle théorie remet alors inévitablement en question le principe de relativité 
restreinte puisque celui-ci ne considère que des référentiels galiléens (en translation 
uniforme, à vitesse constante, les uns par rapport aux autres) et ignore les référentiels 
accélérés, en particulier sous l’effet de forces gravitationnelles. On peut évidemment, 
comme on l’a fait au chapitre 7, parler de dynamique relativiste de particules sou- 
mises à des forces (et donc à des accélérations) dans le cadre de la relativité restreinte, 
mais un examen plus précis des effets dus à ces accélérations montre que la relativité 
restreinte n’est valable que lorsque ces effets sont négligeables. Plus précisément, si 
a est l’accélération subie par un objet sur une distance d, il faut corriger les résultats 
de relativité restreinte par des quantités proportionnelles à ad/c?. 

L'établissement d’un principe de relativité généralisé (aux référentiels accélérés) 
semble donc également nécessaire. 

C’est le principe d'équivalence, que nous allons voir dans cette partie, qui s’est 
révélé être la clef pour réaliser ces deux objectifs. Celui-ci a conduit non seulement 
à la théorie de la relativité générale mais également à la refonte complète de notre 
vision de l’espace-temps, devenu variable dynamique de la théorie et non plus cadre 
rigide dans lequel les objets évolueraient. 


9.1.1 Force de gravitation, forces d'inertie 


Interaction gravitationnelle. L’interaction gravitationnelle est responsable de l’at- 
traction réciproque des corps massifs entre eux. C’est la plus faible des quatre inter- 
actions fondamentales au niveau microscopique mais, grâce à son action à longue dis- 
tance (sa portée est infinie) et à son caractère cumulatif (contrairement, par exemple, 
aux forces électromagnétiques qui tendent à se neutraliser du fait de l’existence de 
charges électriques opposées), elle est la plus intense des quatre interactions aux 
grandes échelles de distance, dans le domaine de la cosmologie par exemple. 

Loi de Newton. Selon la loi de Newton, deux masses ponctuelles m et m’ distantes 
de r s’attirent selon la loi : 


F = -G——e; (9.1) 
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où G = 6,67.107!! m°kg-!s? est une constante appelée constante gravitationnelle 

et où e- est un vecteur unitaire reliant les deux points où sont situées les masses. 
D'une façon générale, le lien entre la densité de matière p et le potentiel gravita- 

tionnel @(r) créé par cette matière au point r est donné par l’équation de Poisson : 


A = 4nGp (r) (9.2) 


dont la résolution permet d’obtenir  (r) ainsi que la force gravitationnelle agissant 
sur une masse test ponctuelle rm : 


F = mg 2:23) 


g = —-Vo (9.4) 


est le champ de gravitation au point r. 

La force dans (9.1) décroit en 1/r? mais ne s’annule pas totalement à grande dis- 
tance : sa portée est infinie. 

Un autre type de force : les forces inertielles. D’autres forces que celles issues 
des quatre interactions fondamentales peuvent également se faire sentir : ce sont les 
forces d'inertie, appelées parfois forces fictives puisqu'elles résultent du mouvement 
et non d’une interaction physique. Ce sont, par exemple, les forces centrifuge et de 
Coriolis dans un référentiel en rotation, ou bien la force d’écrasement que l’on ressent 
dans un véhicule lors d’une forte accélération. 

Plus généralement, ce sont les forces qui agissent sur un objet massif lorsque celui- 
c1 appartient à (ou est observé à partir d’) un référentiel non-galiléen. C’est pour cela 
que l’on appelle parfois référentiels inertiels les référentiels galiléens : ce sont ceux 
où aucune force d’inertie n’apparaît. 

L'existence de tels référentiels inertiels dans l’univers est sujette à caution car tout 
chose (masse ou énergie) tend à créer des effets non-inertiels autour d’elle. L’univers 
dans sa globalité semble être cependant un bon candidat (par exemple en considérant 
le référentiel où le rayonnement du fond diffus cosmologique, présent partout dans 
l’univers, est isotrope), même si cela ne manque pas de soulever des questions quant 
à l’existence d’un tel référentiel universel, peu en accord avec le principe même de 
relativité. 

En pratique, on ne se pose pas ce genre de questions et l’on suppose qu’il existe 
bien au moins un référentiel inertiel, que l’on définit expérimentalement par l’absence 
de toute force d’inertie sur les objets immobiles dans ce référentiel. Comme il est dit 
plus bas, ce référentiel n’est inertiel que localement, c’est-à-dire dans une région 
limitée de l’espace. 
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9.1.2 Deux masses différentes et pourtant égales! 
Deux masses interviennent en physique : 


e la masse inertielle m; qui mesure comment un corps s’oppose à un changement 
de mouvement, et qui intervient dans le Principe Fondamental de la Dynamique : 
F = mia. 


e la masse gravitationelle m, qui mesure comment un corps réagit dans un champ 


gravitationnel et qui intervient dans la loi de Newton (9.1) F = -G er. 





Il n’y à pas de raison, a priori, pour que ces deux masses soient égales. Aïnsi le 
mouvement d’un corps dans un champ de pesanteur g doit, en toute rigueur, s’écrire : 


mia = Myg (9.5) 


Les expériences de Galilée, d’Eütvôs et de bien d’autres (utilisant essentiellement 
la chute libre de masses bien calibrées ou des balances à torsion) semblent néanmoins 
montrer que ces masses sont proportionnelles, et même égales : 


My = Mi (9.6) 


à une impressionnante précision relative inférieure à 107! qui pourrait être amé- 
liorée d’un facteur 1000 dans les prochaines années grâce aux projets spatiaux STEP 
et MICROSCOPE. 

Par conséquent, tous les corps tombent (dans un champ de pesanteur uniforme) à 


la même vitesse dans le vide : 
on 


C’est cette égalité expérimentale qu’Einstein postule comme principe premier, et 
qui sert de base à la relativité générale. 


9.1.3 Un principe fondateur : le principe d’équivalence 


On peut l’énoncer comme ceci : 


Il y a équivalence complète entre un champ de gravitation uniforme et une accé- 
lération uniforme. 


Ainsi, un observateur ne peut pas déterminer, par aucune expérience interne que 
ce soit, si le référentiel qu’il occupe est dans un champ de gravitation uniforme ou 
s’il est dans un référentiel uniformément accéléré par rapport à un référentiel inertiel. 
C’est l’extension aux mouvements uniformément accélérés du principe de relativité 
énoncé précédemment pour les seuls mouvements uniformes. 
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Figure 9.1- Illustration du principe d'équivalence : chute d’un corps dans une fusée, 
accélérée ou non. 


Considérons, pour fixer les idées, l’exemple d’une fusée dans laquelle un observa- 
teur lâche un objet de masse #7 (voir la figure 9.1) qui tombe verticalement vers le sol. 
Sans connaissance de l’environnement extérieur à la fusée (c’est-à-dire sans avoir de 
hublot ou de système permettant d'apprécier, de l’intérieur, le mouvement de la fusée 
par rapport à un référentiel quelconque), 1l peut tirer les conclusions suivantes : 


1. la fusée est immobile dans un champ de gravitation (posée à la surface d’une 
planète par exemple) et l’objet lâché est attiré par la gravité ; 


2. ou bien la fusée est accélérée par rapport à un référentiel inertiel et l’objet lâché 
va dans le sens opposé à ce mouvement accéléré. 


Dans le premier cas, la chute est due à la gravité (g), alors que dans le second cas 
elle est due à une accélération (a). Si a = g, les deux mouvements sont identiques et 
l’on ne peut pas déterminer, par une expérience interne à la fusée, laquelle des deux 
propositions précédentes est correcte. 

Une conséquence directe est que la lumière est défléchie par un champ de gra- 
vitation. En effet, puisqu’un rayon lumineux suit une ligne droite dans un référentiel 
inertiel, le principe d'équivalence implique qu’il subira une accélération, et donc qu'il 
sera courbé, lorsqu'il traversera un champ gravitationnel. 

Ce phénomène est illustré sur la figure 9.2 où le référentiel R;,54 est le référentiel 
d’une fusée en chute libre dans le champ de gravitation terrestre. Celui-ci étant un 
référentiel inertiel, la lumière s’y propage en ligne droite. Dans le référentiel terrestre 
Rrerre, en revanche, la fusée, et par conséquent la lumière, ont une trajectoire courbe 
(parabolique, en fait, dans un champ de gravitation uniforme). 

Les phénomènes de lentille et de mirage gravitationnels sont directement reliés 
à cet effet de courbure des rayons lumineux par un champ de gravitation. En effet, 
lorsqu'un objet très massif (le cœur d’un amas de galaxies par exemple) est situé entre 
un observateur et une source lumineuse, il courbe les rayons lumineux de celle-ci et 
déforme ainsi l’image reçue par un observateur (figures 9.3 et 9.4). Ces phénomènes 
ont été observés dans de multiples circonstances depuis leur découverte en 1979. 
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laser 


a=g A : 
R 


Terre 


Riu en chute libre a 


(moteur éteint) R 


fusée accélérée : 





Figure 9.2 - Courbure d’un rayon lumineux dans un champ de gravitation. Le 
référentiel d’une fusée en chute libre dans le champ de gravitation terrestre étant un 
référentiel inertiel, la lumière s’y propage en ligne droite. Dans le référentiel terrestre, 
en revanche, la fusée, et par conséquent la lumière, ont une trajectoire courbe 
(parabolique dans un champ de gravitation uniforme). 





Figure 9.3 - Schéma de principe de la déviation des rayons lumineux par un objet très 
massif (au centre). La lumière émise par une galaxie est courbée par le champ 
gravitationnel créé par cet objet massif. Il en résulte un effet de mirage gravitationnel, 
sous forme d’arcs lumineux ou d'images multiples observés sur Terre. 

(source libre : http://fr.wikipedia.org/wiki/Lentille_gravitationnelle) 


Il est important de noter que le principe d’équivalence, c’est-à-dire l’équivalence 
entre forces inertielle et gravitationnelle, n’est vrai que localement, c’est-à-dire dans 
une région réduite par rapport aux dimensions caractéristiques de variation du champ 
gravitationnel. II existe en effet deux différences essentielles entre forces inertielle et 
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Figure 9.4 - Image célèbre appelée « croix d’Einstein » où quatre images d’un même 
quasar lointain sont formées par effet de lentille gravitationnelle autour d’une galaxie 
très massive, située au centre de l’image. 

(source libre : http://fr.wikipedia.org/wiki/Croix_d'Einstein) 


gravitationnelle : 1) une force gravitationnelle n’est jamais uniforme, et 2) sa décrois- 
sance particulière à l’infini fait qu’elle ne peut pas être compensée par un changement 
de référentiel global. Par exemple, si la force centrifuge créée par une rotation est 
bien capable de reproduire à l’identique une force gravitationnelle en une zone très 
localisée de l’espace, cette force d’inertie diverge à l’infini, contrairement à la force 
gravitationnelle qui décroit vers zéro!. 

Une force de gravitation n’étant pas uniforme, ses variations, appelées forces de 
marée, tendent à déformer tout objet étendu. 


9.1.4 Effets de la gravité sur les mesures de longueurs 
et de durées 


D'un point de vue expérimental, le principe d’équivalence traduit le fait que le ré- 
férentiel d’un objet en chute libre dans un champ de gravitation est un référentiel 
inertiel, dans lequel il n’y a pas de champ de gravitation (d’où l’effet d’apesanteur 
qu’expérimentent les astronautes, cosmonautes ou spationautes). 





1. La force gravitationnelle varie comme l'inverse du carré de la distance aux objets massifs qui la 
créent, alors que la force centrifuge croît linéairement avec la distance au centre de rotation. 
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Dit autrement, pour ressentir les effets d’un champ de gravitation dans son environ- 
nement, un observateur ne doit pas être en chute libre dans ce champ de gravitation. 
Au contraire, un observateur immobile à une distance r d’une masse M verra les ob- 
jets autour de lui tomber avec l'accélération GM/r° (si ceux-ci sont en chute « libre » 
bien sûr). 

Cette interprétation du principe d'équivalence permet alors de comprendre pour- 
quoi, et comment, la gravité agit sur les mesures de longueur et de durée. 

Comparons pour cela les résultats de mesure (de longueur et de durée) d’un ob- 
servateur ©”, en chute libre dans le champ de gravitation créé par une masse M, avec 
les résultats d’observateurs O,, immobiles dans ce champ de gravitation, à différentes 
distances r de la masse M (figure 9.5). 





Figure 9.5 - Différents observateurs dans le champ de gravitation créé par la masse 
M : O’ (référentiel propre À’) est en chute libre alors que O,;, O2 et O,3 sont des 
observateurs immobiles dans le référentiel où la masse M est immobile. La vitesse de &’ 
par rapport à À augmente lorsque O’ se rapproche de la masse M. 


Le référentiel À’ de l’observateur O’ étant un référentiel inertiel, l’observateur O’ y 
mesure des longueurs et durées propres, par exemple Lo et Afp. À cause de la gravité, 
ce référentiel À’ « tombe » sur la masse M avec une vitesse qui augmente d’autant 
plus que la distance r est faible. Par exemple, partant d’une vitesse initiale nulle à 
une distance infinie de M, la loi de conservation de l’énergie totale (entre l'infini et la 
distance r) nous indique? que le référentiel R’ sera animé, à la distance r de M, d’une 


2. La vitesse de ©’ par rapport à O, est la solution de l'équation de conservation de l’énergie totale 
(entre l'infini et la distance r) : 


Mm 1 , 


M à 
b= -6— +Gr= Dme à GT + mi (9.8) 


c’est-à-dire v = V2GM/r. 
Conformément à ce qui a été dit dans l'introduction de la partie 9.1, cette formule n’est valable que 
tant que l’accélération GM/r° subie par l’observateur O’ est suffisamment faible, c’est-à-dire tant que 
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9.1. Interaction gravitationnelle et notion de relativité générale 


vitesse d’environ V2GM/r par rapport à l’observateur immobile O,. Inversement, 
l’observateur en chute libre verra les observateurs O, aller de plus en plus vite par 
rapport à lui (jusqu’à ce que O” s’écrase à la surface de la masse M !). 

Cette vitesse relative non-nulle entre observateurs conduit alors inévitablement à 
des différences dans les résultats de mesure de longueurs et de durées dans un ré- 
férentiel donné. Par exemple, dans le référentiel R’, lorsque l’observateur O’ mesure 
des longueurs et durées propres Lo et Ato, l’observateur O, mesure des longueurs plus 
courtes L = Lo/y, et des durées plus longues Af = y,Ato, d’un facteur : 


1 GM 
_———— + — 
1 — 2GM 1e 


Il 
| 
— 


"1 (9.9) 


qui augmente lorsque la distance r diminue. Le même raisonnement s’applique bien 
évidemment aux mesures effectuées dans le référentiel R où la masse M est immobile. 
Dans ce cas, c’est l’observateur O’, en mouvement à la vitesse V2GM/r par rapport 
à À, qui mesure des distances plus faibles et des durées plus longues, avec le même 
facteur y,.. 

Ainsi, dans le cas où la masse M est la masse terrestre, plus les observateurs sont 
proches du centre de la terre, plus les effets de la gravité terrestre sur les mesures de 
longueur et de durée sont importants. 


9.1.5 Application : décalage vers le rouge d’origine 
gravitationnelle 


L'exemple du paragraphe précédent nous montre que la présence d’un champ de gra- 
vitation modifie la perception qu’un observateur a des durées. Par extension, tout 
phénomène périodique verra sa fréquence modifiée dans un champ de gravitation. 
Pour les ondes électromagnétiques, le lien entre ce décalage spectral et le champ 
de gravitation peut s’obtenir aisément à l’aide du calcul habituel de l’effet Doppler 
comme on l’indique ci-dessous. 

Considérons, par exemple, le cas d’une source S émettant une onde lumineuse de 
fréquence v (sous forme d’un flash de courte durée) verticalement, vers le haut, à 
partir de la surface d’une planète. Quelle fréquence v’ va capter un détecteur D situé 
à une hauteur h au-dessus du point d'émission ? 

Pour répondre à cette question, utilisons le fait 1) que la lumière se déplace à la 
vitesse c dans tout référentiel inertiel ; et 2) qu’un référentiel en chute libre est un 
référentiel inertiel. 


GM/rc? < 1. Au-delà, l'effet de la gravité ne peut plus être décrit dans le cadre de la relativité restreinte 
et il faut considérer la théorie de la relativité générale, que nous aborderons plus loin. 
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Détecteur Détecteur 





Figure 9.6 - Décalage vers le rouge d’origine gravitationnelle d’une onde lumineuse de 
fréquence y». Dans le référentiel R où la masse M et le détecteur sont au repos, le signal 
lumineux parcourt la distance h à la vitesse c. Dans le référentiel 8’, en chute libre par 
rapport à la masse M, le signal lumineux se déplace encore à la vitesse c, mais la vitesse 
relative entre R et À’ crée un effet Doppler tel que »’(2) < », où z est la distance verticale 
parcourue par le signal depuis le sol. La fréquence au niveau du détecteur est alors 
v(h)=(1-ghc?)r. 


Dans le référentiel en chute libre, l’onde lumineuse parcourt donc la distance A à la 
vitesse c et atteint le détecteur au bout du temps h/c (figure 9.6). Pendant ce temps, le 
référentiel en chute libre a acquis la vitesse v = gh/c par rapport à la surface terrestre 
(si l’on suppose, pour simplifier, que l’accélération gravitationnelle est uniforme et 
égale à g). Dans le référentiel en chute libre, la fréquence de l’onde lumineuse n’a pas 
changé et est restée égale à y. Par contre, ce référentiel inertiel s'éloigne à la vitesse 
v = gh/c du détecteur D au moment de la détection de l’onde lumineuse. Il en résulte 
un effet Doppler vers le rouge (diminution de la fréquence, voir le chapitre 5) : 


g 1 — v/c mi tu ÊE 2 2 
y = all vc)v = (1-ghle)v (9.10) 


où la formule approchée n’est valable que dans le cas d’un faible champ de gravita- 
tion. La variation relative de fréquence est alors égale à : 


gh 


/ 


| Smet À inter Ÿ à (9.11) 
22 


qu'on peut écrire sous la forme : 


1.12) 
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9.1. Interaction gravitationnelle et notion de relativité générale 


où A est la variation du potentiel gravitationnel sur la distance h. Par conséquent, 
un observateur situé à une hauteur h au-dessus de la surface d’une planète mesurera 
un décalage vers le rouge des ondes émises par la planète. 

Puisqu’une fréquence est l’inverse d’un temps (à = + œ a), une autre inter- 
prétation de ce résultat est la suivante : Le rythme d’une horloge située dans un champ 
gravitationnel augmente d'autant plus que le champ (c'est-à-dire l'accélération) est 
fort. 

Cet effet a été testé à de nombreuses reprises, lors de l’émission de signaux électro- 
magnétiques par les sondes explorant le système solaire par exemple, ou en compa- 
rant le temps indiqué par deux horloges atomiques situées à des hauteurs différentes. 
Celles-ci sont maintenant si précises que l’effet a pu être mis en évidence sur une 
différence d’altitude de 30 em (variation relative de 107!7)! 

L'effet de décalage vers le rouge d’origine gravitationnelle est ainsi la principale 
cause de dérive temporelle relativiste du système GPS (voir le chapitre 6). En effet, 
les deux effets relativistes principaux sont : 


1. la dilatation des temps due à la vitesse orbitale des satellites (= 3,8 km/s) : 


ôt 
" = 1-y2-8.107!! (9.13) 
conduisant à une dérive de —7 us par jour (soit une erreur de positionnement 


d’environ 2 km) ; 


2. le redshift gravitationnel (satellites orbitant à une altitude moyenne h;4 = 
20 200 km) : 





Ôt  GMyrr 1 1 L 
pe x | _ ner = +5,4,10710 (9.14) 
[ C Rierre Rierre T sat 


conduisant à une dérive de +46 us par jour (soit une erreur de positionnement 
d’environ 14 km). 


La somme de ces deux effets relativistes conduit alors à une erreur systématique (si 
elle n’est pas corrigée) de +39 us par jour, c’est-à-dire à une erreur de positionnement 
d’environ 12 km. Il est à souligner que l’effet relativiste gravitationnel est bien plus 
important que l’effet de relativité restreinte. 


9.1.6 Le principe de relativité générale 


Selon le principe d’équivalence, la gravitation n’existe pas en soi (puisqu'on peut la 
supprimer en se plaçant dans un référentiel en chute libre) mais n’est qu’une mani- 
festation de notre appartenance à un certain référentiel. 
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x 


Ceci généralise ce que l’on sait déjà sur le mouvement uniforme, à vitesse 
constante, qui est comme rien puisqu'on ne peut pas savoir, par des expériences in- 
ternes au référentiel de l’objet en mouvement, s’il est véritablement en mouvement 
ou au repos. 

Le principe d’équivalence va plus loin et pose que la gravitation, et d’une façon 
générale tout mouvement (accéléré ou non), est comme rien puisqu'on peut toujours 
choisir, localement, un référentiel dans lequel n’est plus ressentie d’accélération. Le 
principe de relativité générale d’Einstein étend alors le principe de relativité res- 
treinte à tout type de mouvement : 


Les lois de la physique doivent avoir la même forme dans tous les référentiels, 
quel que soit leur état de mouvement. 


Du point de vue mathématique, ce principe se traduit par le fait que la forme des 
équations de la physique doit rester inchangée dans une transformation quelconque 
du système de coordonnées (et non plus seulement dans une transformation de Lo- 
rentz). Cette propriété mathématique porte le nom de principe de covariance généra- 
lisée. 


9.1.7 Relativité générale et géométrie 


On a vu aux paragraphes 9.1.4 et 9.1.5 que les longueurs et les durées sont modi- 
fiées par la gravité, c’est-à-dire que la géométrie (au sens étymologique du terme) 
de l’espace-temps est modifiée par un champ de gravitation. Or, dans tous les réfé- 
rentiels inertiels (c’est-à-dire ceux en chute libre dans un champ de gravitation), on 
doit retrouver les lois usuelles de la physique (c’est-à-dire la dynamique relativiste 
restreinte), et en particulier le principe d’inertie : « un corps soumis à aucune force 
se déplace en ligne droite » (et donc reste au même endroit s’il n’a pas de vitesse 
initiale). Le problème est alors le suivant : peut-on garder ce principe d’inertie dans 
tous les référentiels ? Comment le généraliser aux référentiels accélérés ? Ceci oblige 
à redéfinir ce que l’on entend par « ligne droite » car, dans un référentiel accéléré, les 
trajectoires des objets lâchés sont courbes ! (paraboliques en fait, si l’accélération est 
uniforme). 

Einstein suggère alors de considérer une autre géométrie de l’espace-temps, non- 
euclidienne, dans laquelle les trajectoires de ces objets seraient des « lignes droites », 
c’est-à-dire les lignes de plus court chemin entre deux points. En mathématiques, de 
telles lignes s’appellent des géodésiques et leur forme dépend de la géométrie choisie. 
Par exemple, les géodésiques de l’espace euclidien usuel sont les lignes droites, alors 
que les géodésiques d’une sphère sont ses grands cercles, comme le savent très bien 
les navigateurs. 
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Ainsi, la gravité (et toute accélération, de quelque origine que ce soit) affecte la 
géométrie de l’espace-temps en changeant la forme des géodésiques et, par consé- 
quent, la forme des trajectoires suivies par les objets et particules (et en particulier 
les rayons lumineux). L’espace-temps n’est alors plus plat, on dit qu’il est courbe. 
D'une façon générale, toute forme d’énergie (non nécessairement gravitationnelle) 
contribue à changer la courbure de l’espace-temps. 

Dans le cas de faibles champs de gravitation, la géométrie euclidienne habituelle 
reste valide, au moins localement, c’est-à-dire sur de faibles distances. Les résultats 
de relativité restreinte ne sont, eux, valides que tant que les effets des champs gravi- 
tationnels peuvent être négligés. 

Le principe de covariance généralisée nous précise que les lois de la physique 
doivent s’exprimer à l’aide d’objets géométriques définis indépendamment des sys- 
tèmes de coordonnées (des référentiels) choisis. Ces objets, dont les quadri-vecteurs 
de la relativité restreinte en sont un exemple, portent le nom de « tenseur » et l’équa- 
tion fondamentale de la relativité générale est l’équation tensorielle suivante : 


8rG 
[MI = [GI (9.15) 


où [T] est le tenseur impulsion-énergie de l’objet (matière et/ou champ électromagné- 
tique) en mouvement dans l’espace-temps, et [G] le tenseur associé à la géométrie 
courbe de l’espace-temps créée par la distribution de masse. Cette équation n’exprime 
rien d’autre que l’équivalence entre géométrie et matière-énergie : 


Energie et Matière = Géométrie 


Il est à remarquer que l’espace-temps courbe de la relativité générale n’est pas 
localement bien défini car un corps en mouvement dans un champ de gravitation mo- 
difie lui-même ce champ de gravitation (à cause de sa propre masse par exemple !) 
et donc l’espace-temps dans lequel il évolue. Réciproquement, un champ de gravi- 
tation modifie la masse d’un objet, et l’on ne peut pas, en toute rigueur, définir sa 
masse indépendamment du champ de gravité... Ces effets surprenants sont cependant 
généralement s1 faibles que l’on n’en tient pas compte. 

Notons également que, de même que l’accélération d’une charge crée des ondes 
électromagnétiques, l’accélération d’une masse doit créer des ondes, appelées ondes 
gravitationnelles, se propageant à la vitesse de la lumière (figure 9.7). De très faible 
intensité, les ondes gravitationnelles n’ont à ce jour été observées qu’indirectement, 
mais 1l existe de nombreux projets terrestres et spatiaux pour les détecter directement. 
Certains sont déjà opérationnels comme les détecteurs à barre de Weber (en géométrie 
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Figure 9,7 - Simulation numérique d'ondes gravitationnelles émises lors de la collision 
de deux trous noirs. 
(source : Werner Benger, werner@cct.lsu.edu : http://wwwsfb.tpi.uni-jena.de/Projects/B7.shtml) 


cylindrique ou sphérique” ) ou les gigantesques interféromètres de Michelson LIGO, 
VIRGO, GEO et TAMA (Figure 9.8). 


9.2 INTERACTIONS ÉLECTROMAGNÉTIQUE, 
FORTE ET FAIBLE 


Chaque interaction fondamentale peut être caractérisée par essentiellement trois pa- 
ramètres : 
1. le type de charge soumise à l’interaction (ainsi que son caractère cumulatif ou 
neutralisant) ; 


t) 


son intensité relative, caractérisée par un nombre pur appelé constante de cou- 
plage ; 


3. sa portée. 


z 


3. Les barres de Weber sont d’énormes barres de métal très rigides, isolées des vibrations externes et 
refroidies par cryogénie pour diminuer le bruit (interne) d’agitation thermique. Leur fonctionnement 
est très proche des antennes radio usuelles : la distorsion de l’espace-temps créée par le passage d’une 
onde gravitationnelle peut exciter la barre à sa fréquence de résonance et induire une déformation suffi- 
samment importante pour être détectée par des capteurs piézoélectriques. 
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9.2. Interactions électromagnétique, forte et faible 





Figure 9.8 - Photo et schéma de principe de l’interféromètre VIRGO, situé près de Pise 
en Italie. Les deux bras de l’interféromètre de Michelson font 3 km. 
(source : http:/lappweb.in2p3.fr/virgo/ et http://www.ego-gw.it/virgodescription/pag_4.html, contact : 
ego@ego-gWw.it) 


Le modèle standard conduit à envisager toute interaction entre deux particules 
comme un échange entre elles d’une autre particule, dite médiatrice de l’interaction 
(voir la figure 9.9). Le lien entre la portée d’une interaction et la masse m1 de la 
particule médiatrice de l'interaction s'exprime souvent sous la forme : 


portée = h (9.16) 
mc 
où ñ/mc est la longueur d’onde Compton Acompron- 

Cette relation peut se comprendre de la façon suivante : lors d’une interaction 
entre deux particules élémentaires de matière, la particule médiatrice est produite 
de manière « virtuelle » car son émission viole la loi de conservation de l'énergie 
relativiste (en effet, une particule élémentaire au repos de masse m0 ne peut pas, 
selon la relativité restreinte, se transformer en deux particules élémentaires dont l’une 
aurait encore la masse m9). C’est la mécanique quantique, dont l’étude se fera dans 
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Figure 9.9 - Diagramme de Feynman décrivant l’interaction entre deux électrons par 
l’intermédiaire d’un photon y (la particule médiatrice de l'interaction électromagnétique). 
Le temps s’écoule de la gauche vers la droite sur ce genre de diagramme. 


la seconde partie de cet ouvrage, qui permet de résoudre le problème en autorisant 
la violation de la conservation de l’énergie pendant un court instant Ôf. En effet, la 
quatrième relation d’indétermination de Heisenberg indique qu’il peut y avoir un 
écart d’énergie ÔE à condition que la condition suivante soit vérifiée (chapitre 13.3) : 


6Et=h (9.17) 


S1 la particule médiatrice de l’interaction a une masse m, cet écart en énergie doit être 
au moins égal à mc”, ce qui limite la durée pendant laquelle a lieu l’échange de cette 
particule virtuelle : 
ñ 
ES — (9.18) 
mc 
et, par conséquent, la durée de vie de celle-ci. Pendant cet intervalle de temps, la 
particule virtuelle ne peut alors parcourir une distance qu’au plus égal à ñ/mc, ce qui 
fournit un ordre de grandeur de la portée de l’interaction. La relation (9.16) indique 
qu’une portée infinie correspond à l’échange de particules de masse nulle. C’est le cas 
de l’électromagnétisme et de la gravitation, pour lesquelles ces particules se nomment 
photons et gravitons (bien que ces derniers soient hypothétiques car ils n’ont pas 
encore été détectés). 
Nous venons de détailler l’interaction gravitationnelle, passons donc maintenant 
rapidement en revue certaines caractéristiques des trois autres interactions fonda- 
mentales : électromagnétique, forte et faible. 
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9.2. Interactions électromagnétique, forte et faible 


9.2.1 Interaction électromagnétique 


Les particules concernées sont toutes les particules chargées électriquement. La loi 
de Coulomb donne l’expression de la force entre deux particules de charges q et q° : 


-1 ag, 
ATEo 1? 


219) 


où e- est le vecteur unitaire joignant les centres des charges concernées. 

Il existe deux types de charge, positive et négative, ce qui implique l’existence de 
forces attractives ou répulsives. La charge électromagnétique est quantifiée à l’échelle 
microscopique (exemple : proton de charge +e, électron de charge —e, quark de 
charge —-e/3 ou +2e/3). 

L’interaction électromagnétique est au coeur des processus chimiques et biolo- 
giques. À l’échelle atomique (10710 m), c’est l’interaction dominante. Pour caracté- 
riser cette intensité, on peut considérer par exemple le potentiel électrostatique entre 
deux charges identiques (protons ou électrons) distantes de ACompton : e2/ (4xephñ/mo). 
La constante de couplage de l’interaction électromagnétique est alors définie comme 
le quotient de cette énergie potentielle par l’énergie de masse au repos d’une des 
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Cette constante est appelée constante de structure fine. 

La portée de l’interaction électromagnétique est infinie à l’instar de la gravitation. 
A grande échelle (c’est-à-dire pour les objets ou zone macroscopiques), les forces 
peuvent être colossales mais très souvent se neutralisent, du fait de la présence de 
charges opposées. La force résiduelle est appelée force de van der Waals. Bien que 
très faible, cette force résiduelle joue un rôle important dans de nombreux domaines. 

Les particules médiatrices de l’interaction sont les photons, de masse nulle (leur 
portée est bien infinie). 


9.2.2 Interaction forte 


C’est la force responsable de la cohésion des noyaux atomiques. Les particules de 
matière concernées sont les quarks représentant la moitié des constituants élémen- 
taires de la matière (faite de « leptons » et de quarks, et des « antiparticules » as- 
sociées, mais l’interaction forte n’agit que sur les quarks et antiquarks, pas sur les 
leptons (électrons, neutrinos...) n1 sur les photons). Dans le cadre du modèle stan- 
dard, il existe six quarks, dont sont constitués les mésons (assemblage d’un quark 
et d’un antiquark) et les baryons (assemblages de trois quarks), qui sont les deux 
sous-familles des « hadrons ». 
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Les deux quarks les plus présents dans la matière environnante sont les quarks «u » 
(pour up) et « d » (pour down). La charge électrique de ces quarks est différente : 
+2e/3 pour le quark u, et —-e/3 pour le quark d. Ainsi, le baryon « uud » porte bien 
une charge +e (c’est le proton), et le baryon « udd » est bien neutre électriquement 
(c’est le neutron). 


La charge de l’interaction forte n’est pas la charge électrique, c’est la charge de 
couleur. Il existe en fait trois charges de « couleur » : rouge, bleu, vert (ces couleurs 
n’ont évidemment rien à voir avec les couleurs de la lumière). Chacun des six quarks 
existe en trois couleurs (et trois anti-couleurs pour les six anti-quarks). Comme en 
électromagnétisme, les charges de couleur identiques se repoussent et les charges de 
couleur opposées s’attirent. Les hadrons sont des assemblages de quarks de couleur 
« blanche » (équivalent à la neutralité électrique). Comme exemples remarquables, 
on peut citer les nucléons (protons et neutrons) qui sont des assemblages de trois 
quarks (c’est-à-dire des baryons) de couleurs différentes, et les pions qui résultent de 
l’assemblage d’un quark et d’un antiquark (ce sont donc des mésons). 


L’interaction forte est la plus intense des quatre interactions fondamentales au ni- 
veau microscopique. Comme pour l’électromagnétisme, son intensité peut s’expri- 
mer sous la forme d’une constante de couplage qui est le quotient de l’interaction 
forte entre deux nucléons distants de ACompron Par l'énergie de masse au repos d’un 
nucléon : 


g2 
Forte — _ = 15 (9.21) 


où gF est une constante intervenant dans l’expression du potentiel de Yukawa V (r) = 
grexp [-r/Acom puis] /r décrivant l’interaction forte entre nucléons. 


Sa portée est très courte : les quarks n’existent que sous forme liée. L’interaction 
forte est très intense en dessous de 107! m, mais rapidement négligeable au-delà. I] 
en résulte un confinement des quarks dans les hadrons. 


Les particules médiatrices de l’interaction forte entre quarks sont les « gluons ». 
Il existe huit gluons différents. Ils sont « colorés », c’est-à-dire qu’ils portent une 
charge de couleur comme les quarks. Ils sont donc sensibles à l’interaction qu’ils vé- 
hiculent, contrairement aux photons qui véhiculent l’interaction électromagnétique 
entre charges électriques mais ne portent pas eux-mêmes de charge électrique. Ainsi, 
à l’instar de l’interaction gravitationnelle en relativité générale, la théorie de l’inter- 
action forte entre quarks (la chromodynamique quantique) est non-linéaire, ce qui 
complique sérieusement son étude. 

Comme en électromagnétisme, il existe une force résiduelle : c’est la force nu- 
cléaire entre hadrons qui résulte de l’échange de pions entre les nucléons. Il existe 
trois types de pions médiateurs : Z1*, 117, et IT°. 
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9.2. Interactions électromagnétique, forte et faible 


Remarque 


Pour contrebalancer et dépasser la répulsion électrique entre protons au sein des 
noyaux atomiques, la force nucléaire nécessaire est extrêmement forte. || y a tout 
de même une répulsion à très faible distance (traduisant le fait que les nucléons 
ne s’interpénètrent pas). Il existe cependant des étoiles massives où cette répulsion 
entre nucléons est contrebalancée par l'interaction gravitationnelle, ce sont les étoiles 
à neutrons ou étoiles à quarks. 


9.2.3 Interaction faible 


Seules certaines particules sont concernées : celles de spin 1/2 (section 15.4) (par 
exemple, les nucléons). C’est une force très faible par rapport aux autres forces (forte 
et électromagnétique) qui ne peut engendrer de systèmes liés. Sa constante de cou- 
plage est de l’ordre de 10° : 

® faible = 107 (9.22) 


Elle change en fait plus volontiers le type de la matière que son mouvement : elle 
peut ainsi provoquer un changement d'identité, une transmutation des particules. 

Elle est responsable des radioactivités B (transmutation de neutrons en protons) et 
joue un rôle majeur dans les processus de fusion nucléaire (chapitre 8). Les temps de 
désintégration associés sont extrêmement longs (par exemple, la durée de vie d’un 
neutron en dehors d’un noyau est de 15 minutes). 

Les particules médiatrices de l’interaction faible sont les « bosons intermédiaires » 
W*+, W-= et Z° dont la masse est très élevée (traduisant une portée d’interaction très 
faible). La prédiction de l’existence (et de la masse) de ces particules avant confirma- 
tion expérimentale a été l’un des grands succès de la théorie électrofaible, c’est-à-dire 
de la théorie unificatrice des interactions faible et électromagnétique. 

L’interaction faible possède une propriété surprenante : contrairement aux autres 
interactions fondamentales, elle n’est pas invariante par symétrie miroir (c’est-à-dire 
par inversion spatiale des coordonnées) : elle ne conserve pas la « parité » comme 
illustré sur la figure 9.10. 


9.2.4 Variation des constantes de couplage avec l'énergie 


Du fait du phénomène d’écrantage par les autres particules élémentaires (virtuelles ou 
non), les constantes de couplage des interactions fondamentales varient avec l’échelle 
spatiale à laquelle on observe les particules, c’est-à-dire avec l’énergie de ces parti- 
cules. 

En électromagnétisme le phénomène d’écran à longue distance est dû à la pola- 
risation du milieu par les charges électriques. Inversement, aux courtes distances, la 
constante de couplage électromagnétique croît. 

Il en est de même pour la constante de couplage faible grâce au « champ de Higgs », 
responsable supposé de l’acquisition de masse des bosons intermédiaires. 
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Figure 9.10 - Exemple de violation de parité dans la désintégration 8 d’un noyau de 
cobalt 60. A gauche, le phénomène tel qu’il a été observé expérimentalement : l’électron 
est émis préférentiellement dans la direction opposée à celle du spin du noyau 
(symbolisé par la flèche). A droite, l’image dans un miroir parallèle à la direction du spin 
de ce même phénomène : comme le spin est lié à une rotation des charges, cette 
rotation, et donc le spin, est inversée dans l’image, alors que la direction préférentielle 
d'émission des électrons est inchangée. Cette situation « miroir » n’est donc pas celle 
qui est observée expérimentalement : on en conclut que l'interaction responsable de 
cette désintégration n’est pas invariante par parité. 


Inversement, aux courtes distances, les quarks sont quasi-libres (on parle de « li- 
berté asymptotique ») par effet d’anti-écran des gluons. 

Les différentes constantes de couplage semblent converger vers une même va- 
leur aux hautes énergies : les interactions faible et électromagnétique s’unifient vers 
10718 m (10° GeV); les interactions électrofaible et forte s’unifient vers 10°! m 
(10!6 GeV). Il semble que les quatre interactions pourraient s’unifier vers 107% 
(10!° GeV). De grands projets expérimentaux sont en cours (le Large Hadron Colli- 
der (LHC) au CERN de Genève par exemple) pour étudier ces régimes de très haute 
énergie. 


9,3 CONCLUSION : THÉORIES D’UNIFICATION 


Il n’aurait pas été juste de clore ce chapitre sans évoquer les tentatives d’unification 
des quatre interactions fondamentales, qui occupent actuellement plusieurs dizaines 
de milliers de scientifiques à travers le monde. L’unification des théories scientifiques 
est une démarche historique constante. Ainsi en est-il de l’électromagnétisme qui 
résulta de l’union, par Maxwell (et d’autres), de l'électricité et du magnétisme au 
sein d’une même théorie. De même, la relativité générale d’Einstein peut être vue 
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9.3. Conclusion : théories d’unification 


comme l’aboutissement d’un processus unificateur de la gravitation et du mouvement 
qui commença il y a très longtemps. 

La théorie décrivant dans un même cadre interactions faible et électromagnétique 
est la théorie dite électrofaible. Développée par Glashow, Salam et Weinberg, elle fut 
confirmée par la découverte en 1983 des bosons intermédiaires qui étaient prédits par 
cette théorie. 

La théorie décrivant dans un même cadre interactions électrofaible et forte est 
le modèle standard. Développée par de nombreux physiciens, dont $S. Glashow, S. 
Weinberg, A. Salam, M. Gell-Mann et G. Zweig, c’est une très belle construction 
intellectuelle, basée sur la prise en considération de groupes de symétrie. Les don- 
nées expérimentales actuelles, et en particulier la découverte en 2012 du Boson de 
Higgs, sont en bon accord avec les prédictions de cette théorie, qui reste néanmoins 
incomplète car elle contient des paramètres libres que seules les expériences peuvent 
fixer. 

Il existe plusieurs tentatives de « grande unification » du modèle standard avec l’in- 
teraction gravitationnelle : théories des « cordes » et des « supercordes » par exemple. 
L’unification est rendue très complexe par l’absence de charge gravitationnelle néga- 
tive, par l’égalité mystérieuse entre masse inertielle et masse gravitationnelle (c’est- 
à-dire le principe d’équivalence), par la forte non-linéarité de la relativité générale, 
et par le lien entre énergie et géométrie de l’espace-temps. Du fait des énergies gi- 
gantesques qu’il faut atteindre, les expériences actuelles ne permettent pas de tester 
directement ces théories, mais la recherche de tests indirects est très active. 

Il faut noter que la théorie électrofaible et le modèle standard ont pour cadre 
conceptuel commun une description à la fois relativiste et quantique des phénomènes, 
ce qui fournit une transition naturelle vers la seconde partie de cet ouvrage, même si 
celle-ci n’ambitionne que de présenter les rudiments de la physique quantique, et non 
ses développements ultimes. 
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LE MONDE 
QUANTIQUE 





Avec les progrès technologiques des dernières décennies, la planète Terre nous est 
maintenant accessible dans son ensemble : on peut par exemple obtenir à l’aide de 
son smartphone ou son ordinateur des vues très détaillées de n’importe quel point de 
sa surface prises depuis un satellite. Et pourtant la différence entre l’échelle des ob- 
jets nous environnant (typiquement le décimètre) et l’échelle Terrestre (typiquement 
10 000 km) est énorme : huit ordres de grandeur ! 

Effectuons maintenant le même saut de huit ordres de grandeur, mais vers l’infi- 
niment petit au lieu de l’infiniment grand : nous atteignons le nanomètre (10°), 
et nous entrons dans le monde des atomes, des molécules, des mailles cristallines. 
C’est l’échelle privilégiée du monde quantique, dont la description fait l’objet de la 
deuxième partie de ce livre. 

Pour l’infiniment petit, les technologies ont fait aussi de grands progrès dans les 
dernières décennies, et l’on dispose maintenant de l’équivalent microscopique des 
satellites d'observation Terrestre : on peut « voir » les objets et les phénomènes quan- 
tiques individuels, et agir sur eux de manière individualisée et non plus seulement 
avoir accès à des phénomènes résultant de l’accumulation d’un nombre gigantesque 
de phénomènes microscopiques comme c'était le cas auparavant. On assiste actuel- 
lement à l’essor rapide des nanosciences et des nanotechnologies qui explorent et 
exploitent ces nouvelles possibilités. 

Des particules extrêmement petites comme l’électron, le proton et d’autres parti- 
cules élémentaires sont relativement aisées à visualiser individuellement lorsqu'elles 
sont produites dans les accélérateurs de particules en raison de leur très grande éner- 
gie. La figure IL.1 donne un exemple d’« événement » individuel, en l’occurrence le 
résultat d’une collision frontale entre deux protons de très grande énergie. 

Ce n’est que plus récemment qu’on a pu voir des objets microscopiques individuels 
d’énergie bien moindre. La figure II.2 montre à titre d’exemple une photographie de 
l'expérience de D. Wineland, prix Nobel 2012, où l’on voit trois ions qui sont piégés 
par un champ électromagnétique approprié en des points biens précis de l’espace. 
On peut ici préciser ce que « voir » un objet quantique veut dire : la figure montre 
l’image, enregistrée par une caméra, de la lumière émise par ces trois ions bien indi- 
vidualisés lorsqu'on les a excités par un laser. Les lois de l’optique interdisent que les 
taches lumineuses observées sur la figure aient une dimension inférieure à la longueur 
d’onde de la lumière utilisée, en l’occurrence le micromètre. Il faut donc imaginer que 
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Figure 1l.1- Image d’une collision proton-proton unique reconstruite par le détecteur 
ATLAS du Large Hadron Collider du CERN à Genève, montrant les trajectoires de toutes 
les particules produites par la collision. 

(source : CERN) 


chaque ion occupe une zone mille fois plus petite que la tache lumineuse créée par 
sa présence. « Voir » veut donc dire disposer d’un témoin capable de suivre au cours 
du temps la présence d’un objet microscopique individuel. Il en va de même pour 
les trajectoires montrées sur la figure IL.1, qui ont été déterminées par ordinateur à 
partir des signaux électriques provenant des différents détecteurs entourant le point 
de collision. 





Figure 11.2 - Image de la lumière de fluorescence émise par trois ions de Béryllium 
excités par laser. 
(source : NIST, david.wineland@nist.gov : http://www.nist.gov/public_affairs/factsheet/quantum_infosci. 
cfm) 


On peut aussi voir, dans le sens que nous venons de préciser, des particules aussi 
fragiles que des photons, qui sont d’ordinaire très faciles à détruire. La figure IL.3 
montre un résultat de l’expérience de S. Haroche, prix Nobel 2012, qui retrace l’«his- 
toire » de quelques photons individualisés piégés dans une cavité formée de miroirs 
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Figure 11.3 - Les différentes traces montrent l’évolution en fonction du temps de la 
présence d’un nombre donné de photons piégés dans une cavité (de 0 à 5 du premier 

plan au dernier plan) et mesurés de manière non destructive. Aux temps courts, une 
phase initiale d’excitation permet de peupler la cavité avec 1, 2, 3, 4 puis finalement 5 
photons qui subsistent dans la cavité pendant plusieurs millisecondes. Les inévitables 
« fuites » de la cavité éliminent ensuite un par un les photons qu’elle contient, jusqu’à 

son vidage complet (trace au premier plan). La « perte » de chacun de ces photons est un 
évènement soudain précisément enregistré. 
(source : http://www.nobelprize.org) 


de très grande réflectivité et dont on peut connaître le nombre à tout instant sans les 
détruire. 

D’autres techniques sont l’analogue exact du satellite d'observation Terrestre, car 
elles permettent de « voir » la surface d’un solide à l’échelle de l’atome, et la présence 
éventuelle d’atomes différents « adsorbés » sur cette surface, c’est-à-dire collés sur 
cette surface par les forces à courte portée créées par les atomes du cristal. C’est 
ce que l’on observe sur la figure Il.4 qui montre sur quelques nanomètres la surface 
d’un cristal d’oxyde de Cérium observée par microscope à force atomique, avec ses 
atomes régulièrement disposés, sur laquelle on voit quelques atomes supplémentaires 
adsorbés. 

On peut en fait non seulement observer le monde quantique mais agir sur lui de 
manière individualisée, par exemple rectifier la position d’un ion particulier dans un 
piège, remettre un photon dans la cavité dès qu’on sait qu’un s’est échappé, ou encore 
modifier la topographie d’une surface cristalline, comme on peut le voir sur l'exemple 
spectaculaire de la figure IL.S5. 

On peut aussi façonner atome par atome des édifices cristallins ayant des proprié- 
tés particulièrement intéressantes pour des applications diverses. On peut par exemple 
créer des cristaux semi-conducteurs par épitaxie, c’est-à-dire par dépôt successif des 
couches cristallines individuelles, en modifiant de manière contrôlée le type d’atomes 
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Figure 11.4 - Surface d'oxyde de Cérium observée par microscope à force atomique. 
(source : http;//spie.org/x48127.xml, Christoph Richter et al., Nanoworld, Erlangen) 





Figure 11.5 - Surface de cuivre sur laquelle l’expérimentateur construit atome par 
atome un cercle d'atomes de fer adsorbés. 
(« corral quantique », source : Commie, Lutz, Eigler IBM) 


déposé. On crée ainsi un monocristal de taille macroscopique dont la composition est 
contrôlée au niveau de l’atome, comme on le voit sur la figure IL.6 qui montre une 
coupe transverse d’un cristal ainsi fabriqué. Ce type de matériau a en particulier des 
propriétés optiques intéressantes. Il est à la base de la fabrication de « lasers à puits 
quantique » qui sont largement utilisés dans les réseaux actuels de télécommunica- 
tion. On voit donc que les nanotechnologies ne sont pas de simples amusements de 
laboratoires, mais débouchent sur des applications essentielles pour notre monde ac- 
tuel, en microélectronique pour construire des ordinateurs de plus en plus compacts 
et performants et dans les technologies de l'information. 

Dans les chapitres qui suivent, nous allons décrire progressivement les caractéris- 
tiques essentielles du monde quantique et introduire les lois qui le régissent, connues 
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Figure 11.6 - Coupe d’une hétérostructure cristalline InAs/AISb fabriquée par épitaxie 
par jet moléculaire. Les atomes formant la structure sont clairement visibles et ont été 
déposés couche par couche. L'épaisseur de chaque couche d’InAs ou d’AISb est de 
1,8 nm. On remarque que la structure régulière du cristal se maintient même lorsque le 
cristal change de composition. 

(source : Institut Max Planck de la physique des microstructures, Halle) 


sous le nom de mécanique quantique. Celles-ci vont nous sembler souvent étranges, 
car elles diffèrent de celles qui sont tirées de notre expérience quotidienne et bâties 
sur des observations effectuées à notre échelle humaine, 10° fois plus grande. L'objet 
de ce livre est d’en saisir les aspects essentiels, de se forger peu à peu une «intuition 
quantique », sans toutefois entrer dans les détails de la description d’objets comme 
les atomes, les molécules, les solides ou la lumière, sujets pour lesquels le lecteur se 
réfèrera à des manuels plus détaillés et spécialisés, dont nous mentionnons certains 
dans la bibliographie à la fin de ce manuel. 
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LE PHOTON : 

UNE INTRODUCTION 
À LA PHYSIQUE 
QUANTIQUE 


SXENcarr 10.1 Le photon: retour à la conception corpusculaire de la 
: lumière ? 


Comme nous l’avions indiqué au chapitre 2, dans la deuxième moitié du 
XIX® siècle, Maxwell avait établi sur des bases solides la nature ondulatoire de la 
lumière, en montrant qu’elle était une onde de champ électrique et magnétique 
obéissant à quatre équations, les équations de Maxwell. De nombreux physiciens 
avaient approfondi cette analyse, en particulier Hertz et Lorentz, et montré que 
les phénomènes lumineux connus trouvaient une explication satisfaisante dans 
ce cadre. Hertz avait expérimentalement montré qu'il existait aussi des ondes 
électromagnétiques de plus basse fréquence, les ondes dites hertziennes, qui 
avaient des propriétés analogues à celles de la lumière. A la fin du XIX® siècle, 
les physiciens pouvaient être satisfaits : ils avaient résolu pour l’essentiel le pro- 
blème de la lumière. 


Il revient au même Hertz d’avoir introduit une première lézarde dans cet édifice, 
par sa découverte fortuite du phénomène dit « effet photoélectrique », que nous 
décrirons en détail dans les paragraphes 10.1.1 et 10.2.2, et qui ne trouvait pas 
d'explication simple dans l'approche électromagnétique. De même, la répartition 
spectrale de la lumière émise par un corps chauffé (appelé « rayonnement du 
corps noir »), étudiée expérimentalement à la fin du XIX® siècle, ne semblait pas 
pouvoir être expliquée de manière satisfaisante en termes d'ondes de Maxwell. 
C'est Max Planck qui, à l’orée du XX° siècle proposa une explication à ce dernier 
phénomène, et montra qu’on trouvait la bonne répartition spectrale à condition 
de supposer que les échanges d'énergie entre la matière et la lumière se fai- 
saient par blocs insécables, ou « quanta », hy proportionnels à la fréquence » du 
rayonnement, introduisant ainsi sa fameuse constante h, la constante de Planck, 
caractéristique des phénomènes quantiques. 


Reprenant et approfondissant cette hypothèse révolutionnaire, Einstein en 1905, 
en même temps qu'il établissait les bases de la relativité restreinte, émettait 
l'hypothèse que « l’énergie d’un rayon lumineux émis par une source ponctuelle 
n’est pas continüment distribuée dans un volume de plus en plus grand, mais 
consiste en un nombre fini de quanta d'énergie qui sont des points localisés dans 
l’espace, se déplacent sans se diviser, et qui peuvent être produits et absorbés 
en unités complètes ». Il était alors en mesure d’expliquer simplement l'effet 
photoëélectrique découvert par Hertz : il s’agissait donc du retour, mais sur des 
bases bien différentes, de l'hypothèse corpusculaire chère à Newton. 
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Mais il fallait bien évidemment rendre compatible l'approche ondulatoire de Max- 
well, qui expliquait l’ensemble des phénomènes d’interférence et de diffraction 
observés jusqu'alors, et l'approche corpusculaire d’Einstein qui expliquait l'effet 
photoëélectrique et le rayonnement du corps noir. C’est ce qui a été accompli au 
XX® siècle par un certain nombre de physiciens au premier rang desquels on peut 
citer Dirac et Glauber. A partir des concepts quantiques généraux, c’est-à-dire du 
formalisme de la mécanique quantique élaboré dans les années 1920, ils mirent 
au point une théorie, appelée « électrodynamique quantique », ou « optique quan- 
tique », qui explique par un formalisme unique l’ensemble des phénomènes lu- 
mineux connus jusqu’à présent. || n’est pas question de la présenter dans ce 
manuel, dont le but est d'introduire un certain nombre de concepts simples per- 
mettant une première approche de ces phénomènes. 


10.1 LE PHOTON : UN FAIT EXPÉRIMENTAL 


De nombreuses expériences simples permettent de démontrer la nature corpuscu- 
laire de la lumière. Prenons l’exemple d’une mesure réalisée quotidiennement par 
les physiciens contemporains : la mesure de la distance entre la Terre et la Lune 
(figure 10.1). Grâce à des réflecteurs posés sur la Lune par les différentes missions 
spatiales, qu’elles soient américaines ou russes, 1l est possible d’obtenir cette distance 
en mesurant le temps que met une impulsion lumineuse émise depuis un observatoire 
Terrestre pour faire l’aller-retour. Les ordres de grandeur de cette expérience sont tout 
à fait remarquables. Des impulsions lumineuses d’environ une centaine de picose- 
condes et d’énergie 200 mJ sont émises depuis la Terre, mais du fait de la diffraction, 
qui élargit le faisceau à l’aller et au retour, et de la petite taille des réflecteurs lunaires, 
seule une toute petite partie de l’énergie revient dans le détecteur environ 2 s plus tard. 
Si on fait un bilan énergétique complet on trouve qu’il y a un rapport 107 entre la 
puissance envoyée et la puissance reçue ! Expérimentalement, on observe qu’à ces 
puissances extrêmement faibles le détecteur ne se comporte plus de façon linéaire. 
Il produit un signal qui n’est pas celui qu’on observerait sur l’impulsion initiale di- 
visé par 1070 : la plupart du temps le signal est nul, mais pour environ une impulsion 
sur cinquante on observe l’apparition d’une brève « bouffée », que nous appellerons 
« clic » et qui est d'intensité constante : V’arrivée d’un photon a été enregistrée par le 
détecteur. L'arrivée de ces photons est totalement irrégulière : c’est une illustration 
directe de la nature probabiliste de la théorie quantique que nous allons décrire dans 
ce chapitre. L’énergie moyenne reçue par impulsion étant environ 50 fois plus faible 
que celle d’un photon unique, celui-ci étant insécable, au lieu de détecter 1 cinquan- 
tième de photon à chaque tir on détecte un photon arrivant au hasard, en moyenne 
une fois tous les 50 tirs. 
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10.1. Le photon : un fait expérimental 


Lune 








Réflecteur 


Télescope 


Figure 10.1- Laser Terre-Lune : on mesure le temps d’aller-retour d’une brève 
impulsion laser, émise depuis un télescope, et réfléchie par un dispositif posé sur la 
Lune. Le détecteur Terrestre reçoit en moyenne un photon toutes les cinquante 
impulsions lumineuses. 


10.1.1 L'effet photoëélectrique 


Revenons à l’effet photoélectrique mentionné dans l’encart 10.1 : Hertz découvre en 
1887 que de la lumière incidente sur un conducteur électrique peut lui arracher des 
électrons. En 1902, Lenard démontre expérimentalement que c’est le nombre d’élec- 
trons émis qui augmente linéairement avec la puissance du rayonnement incident et 
non l’énergie de ces électrons. Par contre, cette dernière dépend linéairement de la 
fréquence du rayonnement. 

En 1905, Einstein postule l'existence de quanta de lumière, qui seront appelés plus 
tard « photons », dont l’énergie E est proportionnelle à la fréquence y de la lumière 
considérée : 

E = hv = hw (10.1) 


où &w = 2xy est la pulsation de la lumière, À + 6,6.107% J.s est la constante de Planck 
et À = _ & 1074 J.s est appelée « constante de Planck réduite ». 

L’explication de l’effet photoélectrique est alors très simple si l’on suppose que 
l'interaction se fait quanta par quanta avec conservation de l’énergie pour chaque 
processus élémentaire : un photon incident sur la plaque métallique éjecte un élec- 
tron, et l'énergie Esecrron de l’électron émis est égale à l'énergie du photon incident 
diminuée de l’énergie d’extraction Wisaction NÉCeSSaire pour arracher l’électron à la 
plaque. 

Electron = hy es Wextraction (10.2) 


Il en résulte qu’il y a un seuil d’énergie, donc de fréquence, pour que le processus soit 
possible : l'énergie hv du photon incident doit être supérieure à l’énergie d’extraction 
Woxrraction. Enfin le nombre d'électrons arrachés est, dans les conditions idéales, égal 
au nombre de photons incidents. 
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10.1.2 La lumière, c’est combien de photons ? 


Le spectre de la lumière visible se situe autour de la longueur d’onde de 600 nm, et la 
fréquence associée est d’environ y = 500 THz. L'énergie d’un photon visible est donc 
de l’ordre de E = hy + 4.107! J. On remarque que c’est de l’ordre de l’électron-Volt 
(1,6.107!°? J). Le photon a donc une énergie très petite, qui est néanmoins détectable 
par des détecteurs suffisamment sensibles. Pour se rendre compte de l’énergie du 
photon on peut utiliser l’unité traditionnelle du nombre de particules individuelles 
dans le monde macroscopique : la mole. Une mole de photons contient une énergie de 
6.10*x4.107!? + 200 kJ. Une ampoule électrique qui émet une puissance lumineuse 
d’une dizaine de Watt émet 0,00005 mol de photons par seconde, autrement dit avec 
une mole de photons on peut éclairer une pièce pendant environ 5 heures 30 ! Ainsi, 
avec une simple pile on peut alimenter une lampe pendant des dizaines d’heures (les 
moles de réactif dans la pile étant directement transformées en moles de photons)!. 

On peut aussi prendre l’exemple du pointeur laser qui délivre une puissance lu- 
mineuse d’1 mW. En divisant cette puissance par hv + 4.107!° J, on obtient le flux 
numérique de photons, qui est d’environ 2,5.10!* photons par seconde, tous de même 
fréquence et se propageant dans la même direction. 


10.1.3 La détection des photons 
La détection des photons est assurée par divers dispositifs : 


e les bolomètres, ou Wattmètres, détectent la puissance lumineuse par l’effet 
d’échauffement produit par la lumière. La plupart fonctionnent avec des flux de 
photons importants, correspondant à des puissances lumineuses macroscopiques, 
où la « granularité » de la lumière n’est pas visible. Certains, refroidis à la tempéra- 
ture de l’Hélium liquide, sont suffisamment sensibles pour mesurer l’échauffement 
produit par un seul photon ! 


e les photodiodes sont basées sur l’effet photoélectrique, où, comme nous venons 
de le voir, des électrons sont arrachés à la matière sous l’effet des photons inci- 
dents. Le courant d’électrons ainsi créé est proportionnel à la puissance lumineuse 
P. Lorsqu'on atténue fortement la lumière pour atteindre des puissances de l’ordre 
de 107 1$5W et qu’on utilise des photodiodes suffisamment sensibles, on constate 
comme dans l’exemple de la mesure de la distance Terre-Lune que le courant me- 
suré ne diminue pas uniformément : il apparaît comme formé de brèves « bouffées » 
de courant ou « clics », de formes identiques, correspondant à l’arrivée aléatoire 
des photons, arrivées de plus en plus rares lorsqu’on diminue l’éclairement. C’est 
le recouvrement de ces « bouffées » lorsqu’on augmente la puissance incidente qui 


1. Pour plus de détails voir J. M. Courty et N. Treps, « La Lumière, c’est combien de photons ? », 
Dossier Pour la Science 53, octobre-novembre 2006. 
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10.2. Propriétés du photon 


crée le signal macroscopique continu. Il existe aujourd’hui des photodiodes ayant 
des efficacités quantiques supérieures à 90%, autrement dit qui ont 90% de chance 
de détecter un photon incident. 


e L’œil humain est un remarquable détecteur, car il est sensible à quelques photons : 
en effet, connaissant la taille de la pupille, la luminance de sources (comme une 
nuit de pleine Lune, ou l'étoile la plus faible visible à l’œil) et le temps de ré- 
manence de l’œ1l, on trouve qu’une dizaine de photons suffit à former une image 
visible. 


10.2 PROPRIÉTÉS DU PHOTON 


10.2.1 Énergie et quantité de mouvement 


Chaque photon contenu dans un faisceau de lumière monochromatique décrit par une 
onde plane de fréquence v et de vecteur d’onde Kk a une énergie E et une quantité de 
mouvement p données par : 


E=hv ; Ipl=#/4 (10.3) 


La direction du vecteur p est celle de la direction de propagation de l’onde, et h est 
la constante de Planck. On peut aussi écrire la relation plus symétrique : 


E=how ; p=f#k (10.4) 


À partir de la relation relativiste (7.55) du chapitre 7 reliant E, p et la masse m de 
la particule : E? — pc? = m°c“* et de la relation w° = c?k?, on déduit que m = 0. Le 
photon est donc une particule de masse nulle et qui se déplace dans le vide à vitesse 
constante, toujours égale à c. Elle est donc à la fois quantique et relativiste. 


10.2.2 Processus élémentaires d’émission et d'absorption 
de photons 


a) Propriété fondamentale 


L’interaction entre la lumière et un objet tel qu’un atome, une molécule, un solide, 
se fait par processus élémentaires mettant en jeu un seul photon. I y a conservation 
de l’énergie et de la quantité de mouvement dans chaque processus élémentaire. Si 
E et p sont l’énergie et la quantité de mouvement de l’objet avant le processus, et E” 
et p’ l’énergie et de la quantité de mouvement de l’objet après le processus, on peut 
écrire, pour un processus d’absorption de la lumière par l’objet (donc d’annihilation 
du photon) : 

E+hy=E" ; p+ñk=p (10.5) 
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et pour un processus d’émission de la lumière par l’objet, donc de création d’un 
photon (figure 10.2) : 





E=E'+hy : p=p+#k (10.6) 
Énergie Énergie 
E2 
{| | | A] 
-e.-. hv = E-E 
Photon É 
a) Absorption b) Émission 


Figure 10.2 - Diagramme montrant les deux niveaux de plus basse énergie E; et E 
d’un atome. a) Excitation de l’atome par absorption d'un photon incident; b) 
Désexcitation de l’atome par émission d’un photon. 


b) Exemples 


Comme on le verra par la suite de manière plus détaillée, l'énergie E d’un objet quan- 
tique ne peut pas prendre n'importe quelle valeur. Elle ne peut prendre qu’un certain 
nombre de valeurs bien précises Æ;,E2,..., correspondant à des configurations, ou 
états, différents. On dit alors que l’énergie de ces systèmes ou objets est quantifiée. 
C’est le cas des atomes ou des molécules (figure 10.2). Elle peut aussi appartenir à 
des intervalles d'énergie Ein < E < Ex. On parle alors de « bandes » d’énergie, 
ou de « continuums » (figure 10.3). C’est le cas des solides. Lorsque le système a la 
plus basse énergie possible, on dit qu’il est dans l’état fondamental. 

Donnons quelques exemples de ces processus d'émission et d'absorption de lu- 
mière : 


+ Diode électroluminescente (LED). Le système formé par le contact entre deux 
semi-conducteurs constitue une diode, système quantique qui présente des bandes 
d'énergie : une bande supérieure E, in < E < E, max; appelée bande de conduc- 
tion, et une bande inférieure Ein < E < Es max: appelée bande de valence (avec 
Ecmin > Ev,max). Un courant électrique 7 (en ampères) appliqué aux bornes de 
cette diode permet d’apporter des électrons dans la bande supérieure. Il peut y 
avoir alors émission d’un photon, et le système se trouve à la fin dans la bande 
de valence de plus basse énergie. La fréquence du photon émis est alors telle que 
AV > Ein — Ev,max: Dans les condition idéales, chaque électron formant le courant 
électrique d’alimentation fournit un photon : le courant numérique de photons est 
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10.2. Propriétés du photon 


Énergie 


RAR 


Courant 
électrique 


= hv = Ec,min é Evmax 





Ù 
Eymax Photon 





E, min 


Figure 10.3 - Diagramme montrant les deux bandes d'énergie [Es in, Ec max] et 
[Emi Ev.max] accessibles à un électron dans une diode électroluminescente (LED). Un 


courant électrique appliqué sur la diode apporte les électrons à une énergie située dans 
la bande d'énergie supérieure. La diode se désexcite vers un niveau d'énergie situé dans 


la bande inférieure avec émission d’un photon. 


égal au courant numérique électrique. La puissance lumineuse émise vaut alors : 


_ 
q 


P (10.7) 


avec g = 1,6.1071° C. Si y correspond à la lumière jaune de longueur d’onde 0,6 
um, un courant de 1 mA dans la LED produit une puissance lumineuse de 2,5 mW, 
proche de celle du pointeur laser. 


Réaction photochimique. On considère deux molécules A et B qui, mises en 
contact forment, par réaction chimique, une autre molécule AB, système quantique 
qui possède des niveaux d'énergie définis (on dit aussi « discrets »). Dans certains 
cas, la réaction exothermique produit la molécule dans un niveau d'énergie E; su- 
périeur à l’énergie Eo de l’état fondamental, et il y a émission d’un photon lorsque 
la molécule AB transite vers l’état fondamental : la réaction chimique produit de 
la lumière. La fréquence du photon émis vaut (E, — Eo)/h. Une mole de réactif A 
donne alors naissance à une mole de photons, soit 200 KJ pour la lumière jaune. Si 
la réaction est rapide, voire explosive, et épuise les réactifs en une seconde, on a un 
flash de lumière très intense, de puissance 200 KW. Si la réaction est lente et dure 
une heure, il y a émission pendant ce temps de lumière de puissance 56 W. C’est 
ce qui se produit dans les « bâtons lumineux » qu’on trouve dans les fêtes foraines. 


Effet photoélectrique. Nous l'avons déjà abordé dans le paragraphe d’introduc- 
tion : un électron dans un métal possède un état fondamental d’énergie Eo et une 
bande d’énergie, ou continuum dont l’énergie inférieure vaut E,,;, (figure 10.4). 
Le premier état correspond à l’électron confiné dans le métal et libre de s’y dé- 
placer. Le continuum correspond à l’électron éjecté du métal. Lorsqu'on éclaire 
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le métal, il y a un processus d’absorption, où le photon du faisceau est absorbé et 
communique son énergie à l’électron. Si sa fréquence est trop faible, telle que 
hv < Ein — Ep = Wexraction: le processus ne peut avoir lieu. Si au contraire 
hv > Ein — E0 = Wextractions V'électron peut se trouver à l’issue du processus 
dans un état du continuum, donc être éjecté du métal, et on peut le recueillir sur 
une électrode. La lumière produit donc dans ce cas un courant d'électrons. C’est le 
processus inverse de celui qui se produit dans une diode électroluminescente : le 
courant numérique d'électrons y est (dans les conditions idéales) égal au courant 
numérique des photons incidents. Pour la lumière jaune, 2,5 mW de lumière pro- 
duisent 1 mA de courant électrique, ou de manière équivalente, 1 mW de lumière 
produit 0,4 mA de courant. 


Énergie 









Na 


Figure 10.4 - Diagramme montrant le niveau de plus basse énergie E et la bande 
d'énergie [Ein Emax] accessibles à un électron dans un métal. Sous l'effet d’un photon 
incident, l’électron initialement dans l’état de plus basse énergie passe dans la bande 

d'énergie supérieure, qui correspond à un électron éjecté hors du métal avec une 
certaine énergie cinétique (effet photoélectrique). 


e Excitation et modification de la vitesse d’un atome. Un atome possède des ni- 
veaux d'énergie discrets E, < E3 < .…. S’il se trouve dans son état fondamental 
de plus basse énergie, Il peut effectuer un saut vers le niveau excité d'énergie E> 
en absorbant un photon de fréquence y telle que : 

E) - E 
ges ee + 
h 
C’est la règle de Bohr. I y a aussi conservation de la quantité de mouvement au 
cours du processus. Si M est la masse totale de l'atome, v; sa vitesse initiale, et v} 
sa vitesse après absorption du photon de vecteur d’onde k, on a donc : 


Mv; +fk = MY; (10.9) 


(10.8) 


L’atome change donc de vitesse sous l’effet du rayonnement, d’une quantité qui 
vaut 4k/M, de l’ordre du cm.s_! pour un atome de masse M = 1077 kg. La varia- 
tion est faible, mais non négligeable. Une fois excité, l’atome revient dans son état 
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de plus basse énergie en un temps de l’ordre de 107$ s. Il est alors prêt à absorber un 
nouveau photon qui va provoquer un nouveau changement de vitesse identique, de 
l’ordre du cm.s”!. Le taux de changement de vitesse, c’est-à-dire l’accélération ou 
la décélération appliquée par un faisceau laser à l’atome est donc de 1 em.s”!/107$ 
s = 106 m.s >, c’est-à-dire 10° fois l’accélération de la pesanteur Terrestre ! 
Ainsi, si on utilise des faisceaux convergents de fréquence bien ajustée (f- 
gure 10.5), on peut amener la vitesse de l’atome à une valeur pratiquement nulle, 
correspondant à des températures de l’ordre de 10° K. 





Figure 10.5 - Les atomes contenus dans une cellule et soumis à six faisceaux laser 
convergents en présence d’un champ magnétique inhomogène sont piégés et maintenus 
à très basse température au centre du dispositif. 

(source : Institut Non Linéaire de Nice) 


Remarque 


Il'existe en fait d’autres processus élémentaires que ceux que nous venons d'évoquer 
dans cette partie, qui mettent en jeu non pas un mais plusieurs photons. On les ap- 
pelle processus multiphotoniques. Par exemple, il peut y avoir transition d'un atome 
de son état fondamental à un état excité par absorption simultanée de deux photons. 
Ces processus sont la plupart du temps beaucoup moins probables que ceux à un 
seul photon, ou bien nécessitent de très grands éclairements lumineux. 


10.3 TEMPS ET LIEU D'ARRIVÉE DU PHOTON 


10.3.1 Temps d'arrivée du photon dans un faisceau 
lumineux stationnaire 


On constate expérimentalement que les photons contenus dans un faisceau lumineux 
stationnaire, de puissance constante, arrivent au hasard, et que l’instant exact d’arri- 
vée d’un photon ne peut être prédit, même en contrôlant parfaitement la source. Le 
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nombre de photons N arrivant dans un intervalle de temps 7 donné est une quantité 
intrinsèquement fluctuante : les phénomènes quantiques individuels sont de nature 
statistique. 

Considérons un phénomène stationnaire, où la probabilité de détecter un photon 
ne dépend pas du moment où on fait la détection, mais de la durée de cette détec- 
tion. C’est une situation typique d’une source lumineuse continue composée d’un 
grand nombre d’émetteurs aléatoires indépendants. Ainsi, pour un détecteur faisant 
de multiples mesures, chacune pendant un temps Af, on appelle X; la variable aléa- 
toire associée au nombre de photons détectés lors de la 1 mesure. Le nombre moyen 
de photons mesurés V pendant une mesure est alors égal à la moyenne des mesures 
effectuées (pour un grand nombre de mesures). On écrit, en anticipant sur les nota- 
tions de la mécanique quantique, N = (X) (où l'indice i a été omis car la moyenne 
est indépendante de la mesure considérée). On peut montrer ? que les probabilités de 
mesure suivent une loi de Poisson (figure 10.6) : 


\ 71 


Proba{X; = n) = Fat (10.10) 


n! 


0,15 


0,10 


0,05 





Figure 10.6 - Histogramme du nombre de photons mesurés à l’aide d’un compteur de 

photons sur une source lumineuse très faible pendant un intervalle de temps donné. La 

valeur moyenne du nombre de photons détectés est de 5, et l’écart-type autour de cette 
valeur est de V5. 


Considérons maintenant la variance du nombre de photons mesurés, qui représente 
les fluctuations d’une mesure à l’autre. On a : 


Var(X) = AX? = (X2) - (X}? 


2. John Taylor, /ncertitudes et analyses des erreurs dans les mesures physiques, Dunod 2000. 
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10.3. Temps et lieu d'arrivée du photon 


Dans le cas d’une loi de Poisson, on montre que la variance est égale à la valeur 
moyenne AX? = N. Cela signifie que si on effectue une mesure unique on a 68 % de 
chance qu’elle soit dans l'intervalle [N — VN N + VN Jet 95 % de chance qu’elle 
soit dans l'intervalle [W — 2 VN,N +2 VW]. 

On voit que naturellement le nombre de photons par unité de temps fluctue. Cela 
a-t-il une influence sur des mesures macroscopiques ? Si on considère un faisceau 
laser de quelques milliwatts, cela correspond à environ 10!$ photons par seconde. La 
variance associée à une mesure d’une seconde est donc 10 photons, soit une fluc- 
tuation relative de 10-$, toute petite. Prenons par contre le cas d’un appareil photo 
numérique, et faisons le calcul dans l’autre sens, quel est le nombre minimal de pho- 
tons par pixel permettant une image de qualité ? Si on considère qu’une fluctuation 
de 1 % est raisonnable, cela correspond à 10 000 photons en moyenne par pixel. 
Pour 10 millions de pixels, il faut donc environ 10!! photons pour former une image 
correcte. C’est ce nombre qui fixe la limite du temps d’exposition pour les prises de 
nuit. 


10.3.2 Lieu d’arrivée du photon : éclairement uniforme 


Certains appareils photographiques numériques CCD (Charge Coupled Device) sont 
extrêmement sensibles, à tel point qu’ils peuvent enregistrer l’arrivée d’un photon 
unique sur un de leurs pixels. On peut ainsi savoir où arrive le photon sur la surface 
sensible du détecteur. 

Considérons tout d’abord le cas où le CCD est soumis à l’éclairement uniforme 
d’une onde lumineuse plane : si elle est suffisamment intense, chaque pixel fournira 
un signal identique, et la photo montrera une teinte plate (c’est-à-dire uniforme). Si 
l’on baisse l’intensité incidente tout en maintenant le caractère uniforme de l’éclai- 
rement, on constate que les photons, maintenant détectés un par un, arrivent en des 
points aléatoires de la surface du CCD. On retrouve sur l’aspect spatial le caractère 
probabiliste de la détection qu’on avait vu précédemment sur l’aspect temporel. Si on 
mesure le nombre de photons arrivant sur différentes zones de même surface du CCD 
pendant le temps d’ouverture de l’appareil photo, on obtiendra une qualité fluctuante 
de zone en Zone, avec ici aussi une statistique de Poisson et une variance égale à la 
racine carrée de la valeur moyenne. 


10.3.3 Lieu d’arrivée du photon : cas de la lame 
semi-réfléchissante 


Considérons un système composé d’une source lumineuse et d’une lame séparatrice 
(L) (figure 10.7) qui divise le faisceau incident en deux faisceaux de même puissance. 
Nous avons déjà rencontré une telle lame dans le chapitre 2 au cœur de l’interféro- 
mètre de Michelson. 
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A0 1 Aow2 


NE V L Vi 
V2 V2 
(a) Fe (b) 


Figure 10.7 - a) Une onde lumineuse arrivant sur la lame semi-réfléchissante se divise 
en deux ondes d’amplitudes égales b) Les photons arrivant sur la lame ne peuvent pas 
être coupés en deux : ils se répartissent aléatoirement sur les deux faisceaux de sortie. 


Dans le point de vue de Maxwell, si À = Ao exp(i(kz — wt)) représente le champ 
électrique en notation complexe avant la lame, les champs électriques sur les deux 
faisceaux issus de la lame s’écrivent respectivement À; = & exp(i(kz — wt)) et A3 = 


à exp(i(kz — wt)). De cette façon, les puissances lumineuses P = a|A[? (où « est une 
constante de proportionnalité réelle positive) des faisceaux de sortie sont égales, et la 
somme des puissances sur les deux voies de sortie est égale à la puissance incidente 


P1 + P2 = P. 


Qu'en est-il quand on baisse cette puissance et que les photons arrivent un par un 
sur la lame ? Par définition, ceux-ci ne peuvent se couper en deux. Ils doivent donc 
être soit transmis, soit réfléchis par la lame. On est amené à adopter dans ce cas aussi 
une description probabiliste du comportement du photon au passage de la lame, très 
différente de la description déterministe de l’approche ondulatoire : on ne peut savoir 
si un photon donné incident sur la lame va être réfléchi ou transmis. Les probabilités 
de transmission et de réflexion valent : 


1 
Probap, (1) = Probap,(1) = à 


où l’on a adopté la notation Probap(n) pour exprimer la probabilité que le détecteur D 
détecte n photons. Ces probabilités sont parfaitement déterminées, et si on se place à 
la limite d’un grand nombre de photons, on va évidemment retrouver la loi classique. 


On a ici un exemple de tirage au sort caractéristique des phénomènes quantiques. 
Le phénomène fondamentalement aléatoire qui se produit à la traversée d’une lame 
semi-réfléchissante est d’ailleurs utilisé pratiquement dans des dispositifs commer- 
ciaux pour produire des suites de nombres réellement aléatoires, données utiles pour 
le calcul numérique et les jeux de hasard sur Internet, et qu’il est très difficile d’obte- 
nir par d’autres moyens. 
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10.4. Interférences lumineuses et photons 


10.4 INTERFÉRENCES LUMINEUSES ET PHOTONS 


Comment concilier un phénomène aussi intrinsèquement ondulatoire qu’une inter- 
férence avec la granularité introduite par la présence du photon ? C’est ce que nous 
allons analyser plus en détail dans ce paragraphe. 


Considérons deux ondes lumineuses planes, de vecteurs d’onde k et ko, se pro- 
pageant dans des directions différentes du plan xO2z, inclinées d’un angle 6 de part 
et d’autre de l’axe Oz. Elles se superposent donc dans une partie de l’espace (fi- 
gure 10.8). D’un point de vue expérimental, on peut par exemple superposer deux 
faisceaux lasers, ou bien envoyer un faisceau préalablement élargi sur un biprisme de 
Fresnel (figure 10.8b), qui est formé de deux prismes de verre identiques P; et P; 
accolés par leurs bases et qui dévient les parties supérieures et inférieures du faisceau 
lumineux incident dans des directions symétriques par rapport à l’axe de propagation 
initial. 





Figure 10.8 - a) Superposition de deux ondes planes ayant des directions de 
propagation, donc des vecteurs d'onde k et ko: symétriques par rapport à Oz. b) 
Production de deux ondes planes symétriques à l’aide d’un faisceau lumineux élargi se 
réfractant dans deux prismes de verre P, et P; symétriques. 


10.4.1 Interférence entre deux ondes planes : approche 
classique 


Envisageons tout d’abord la lumière comme une onde, que nous supposerons de pul- 
sation w et de vecteur d'onde k. Les vecteurs d’onde des deux ondes planes ont pour 
composantes cartésiennes (—k sin 4,0,k cos 4) et (k sin 4,0,k cos 8). Leurs amplitudes 
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complexes, introduites à la section 10.3.3, sont égales dans ce cas à : 


Ain = Agir cos 8x sin Ou) 
. 


Ar f) = Aoeï cos 0+Kkx sin 0-«wf) 
ie 


Dans la région de recouvrement, l’onde résultante a une amplitude qui est la somme 
des amplitudes de ces deux ondes et qui est donc égale à : 


A(r,n = Ai + A) = 2496 70050700) Cos(kx sin 0) (10.11) 


La puissance lumineuse dans la région de recouvrement est proportionnelle au mo- 
dule carré de l’amplitude complexe de cette onde et vaut donc : 


P(r) = 4aA$ cos”(kx sin 6) (10.12) 


La puissance lumineuse n’est plus uniforme : elle dépend de l’abscisse x du point 
d’observation : si on insère dans cette région un capteur CCD perpendiculaire à 
la direction de propagation Oz on va donc enregistrer une image comportant des 
bandes parallèles à Oy alternativement éclairées et sombres, appelées franges d’in- 
terférences, avec des points où P = 0, donc non éclairées. En ces points « de la lu- 
mière plus de la lumière donne de l’obscurité », car les deux ondes y sont exactement 
égales en valeur absolue et opposées en signe : ce phénomène d’interférence des- 
tructive est caractéristique de la nature ondulatoire de la lumière. Nous l’avons déjà 
rencontré dans une configuration différente, celle de l’interféromètre de Michelson 
(section 2.3.3) 


10.4.2 JInterférences photon par photon 


Utilisons maintenant de la lumière très atténuée (figure 10.9). À très court temps de 
pose, le nombre moyen de photons incidents est très faible, et les photons arrivent sur 
le détecteur CCD en des points aléatoires, sans que l’on sache où va arriver un photon 
donné. On retrouve l’aspect statistique des phénomènes quantiques individuels déjà 
signalé. 

En revanche, lorsqu’on accumule les arrivées de photons sur le détecteur, on voit 
apparaître progressivement une modulation dans la densité des points d’arrivée, qui 
ressemble de plus en plus à la variation de la puissance lumineuse de l’onde dé- 
terminée dans le paragraphe précédent : les franges d’interférence apparaissent. On 
constate qu’en fin de compte la valeur moyenne du nombre de photons mesurés en 
un point donné varie comme l’éclairement ou comme la puissance lumineuse P en ce 
point. 
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@) P(x) 
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Figure 10.9 - (1) Signal détecté par le CCD pour une puissance lumineuse très faible et 
pour des temps de pose de plus en plus longs (de (a) à (d) : 10, 100, 500 et 2000 s; (2) 
Puissance P(x) de l’onde électromagnétique lumineuse en fonction de la position x : la 

probabilité de détecter le photon est proportionnelle à la puissance lumineuse. 
(source : ENS Cachan, http://www.physique.ens-cachan.fr/old/franges_photon/interference.htm) 


On est donc amené à admettre que la probabilité Proba(r) de trouver le photon 
au point r est proportionnelle à la puissance lumineuse P en ce point, elle-même 
proportionnelle au carré du module de l’onde complexe en ce point” : 


Proba(r) x P x |A(r,t)? 


L’onde « guide » en quelque sorte le photon. Comme le carré du module de l’am- 
plitude A(r,t) donne la probabilité de présence, à une constante multiplicative près, 
on qualifie souvent A(r,t) d’« amplitude de probabilité ». 


3. Le symbole « « » veut dire « proportionnel à ». 
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10.4.3 Discussion 


Prenons l’exemple de l’expérience du biprisme éclairé par un faisceau lumineux très 
atténué dans lequel les photons se présentent de manière isolée à l’entrée du dispositif 
et considérons les trois situations suivantes : 


e 1) On bloque la lumière issue du prisme P;. L’onde plane A, passe seule. L’éclai- 
rement sur le CCD est uniforme et il n’y pas de phénomène d’interférence. La 
probabilité Proba; obtenue dans ce cas ne dépend pas de la position, 


e 2) On bloque la lumière issue du prisme P.. L’onde plane A; passe seule, il n’y 
pas d’interférence et la probabilité Proba; est uniforme, 


e 3) On laisse passer toute la lumière : les deux ondes passent, se superposent et 
interfèrent. La probabilité Proba;,2 n’est plus uniforme. 


On a donc : 
Proba;:2 € Probai + Proba (10.13) 


Supposons un instant que le photon soit une particule classique à laquelle on peut 
attribuer une trajectoire bien définie : il passe donc soit par le prisme supérieur, soit 
par le prisme inférieur, et la probabilité de trouver le photon en un point donné du 
CCD doit être la somme de celles des deux configurations exclusives 1 et 2. Cette 
hypothèse implique donc que Proba;;2 = Proba; + Probai. 

Comme cette égalité n’est pas satisfaite par le photon, on en conclut que celui-ci 
n’est pas une particule classique dont on peut connaître à tout instant la position. 
Pour décrire ses propriétés, il faut à la fois considérer la lumière comme une onde 
dont on ajoute les amplitudes, et comme une particule dont la probabilité de présence 
est liée au carré du module de l’amplitude de cette onde. On constate en particulier 
qu’à l'emplacement des franges noires, où 1l y a interférence parfaitement destructive 
pour l’onde, on peut dire avec certitude que le photon ne sera jamais détecté en ces 
points. De la même manière que de la lumière plus de la lumière peut donner une 
absence de lumière, on peut dire que pour le photon « de la probabilité plus de la 
probabilité peut donner une probabilité nulle ». 


10.5 BILAN 


Ce chapitre nous a permis de voir que des expériences finalement assez courantes 
nécessitent une description de la lumière allant au-delà de la physique classique pour 
être interprétées. Il faut admettre que la lumière a aussi un aspect à la fois « gra- 
nulaire » et aléatoire. La dualité onde corpuscule pour la lumière s’exprime par les 
relations E = hw, p = ñk. Nous avons vu que les échanges d’énergie au niveau mi- 
croscopique se faisaient photon par photon, en respectant la relation hy = E,-E:. Les 
phénomènes quantiques isolés ont un caractère intrinsèquement aléatoire, et l’on ne 
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10.5. Bilan 


peut faire que des prédictions de caractère statistique. Plus précisément la probabilité 
de détection du photon à r et en r est proportionnelle au module carré de l’amplitude 
complexe |A(r,f|? du champ électrique de l’onde lumineuse. Lorsqu'on augmente 
l’éclairement donc qu’on passe à des flux de photons très importants, la granularité 
de la lumière, et son caractère aléatoire associé, n’est plus observable et on retrouve 
une onde « classique » dont l’amplitude varie continûment. 


SEncarr 10.2 Lame semi-réfléchissante, interférences et dualité 
onde-corpuscule 


L'interféromètre de Mach-Zehnder est une variante de l’interféromètre de Michel- 
son que nous avons déjà étudié dans le chapitre 2 (figure 10.10a). Une lame 
semi-réfléchissante L, sépare une onde incidente monochromatique de longueur 
d'onde 1 en deux faisceaux distincts, qui sont ensuite superposés à nouveau sur 
une autre lame semi-réfléchissante L, grâce aux miroirs M, et M,. L’intensité de 
la lumière issue de cette recombinaison varie en fonction de la différence de lon- 
gueur 6 = LM; l; - LM, L entre les trajets des deux ondes : elle présente des 
maxima quand les deux ondes sont en phase après L, (6 = pa, avec p entier). 
Elle s’annule quand les deux ondes sont en opposition de phase lorsqu'elles se 
recombinent (6 = (p+ 1/2)4). 


h M, N() 





M; L 


\1, Al Vi D: 
| \ Vds 
Photon 
unique 


à 
A || 
U 





D; 


Figure 10.10 - a) Interféromètre de Mach-Zehnder; b) L'absence de comptage en 
coïncidence sur les voies VA et V; montre que le photon est passé par une seule des 
deux voies V, et V, ; c) Signal interférométrique détecté par le compteur de photons 

pour deux temps de pose différents (en haut 10 s, et en bas 2000 s). 
(Figure reproduite avec permission depuis A. Aspect, P. Grangier, G. Roger, Europhysics 
Letters, vol. 1, p. 173 1986) 
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L'expérience que nous allons décrire, réalisée à l’Institut d'Optique d'Orsay, 
permet de bien mettre en évidence l’étrangeté de la dualité onde-corpuscule. 
Elle consiste à envoyer de manière répétitive un photon unique à l’entrée de 
l’interféromètre de Mach-Zehnder et à réaliser successivement deux séries de 
mesures : 


e La première (figure 10.10b) consiste à détecter d'éventuelles coïncidences 
entre les arrivées des photons sur deux compteurs de photons D; et D; in- 
sérés sur les deux voies de sortie V, et V; de la lame semi-réfléchissante L:. 
L'expérience n’en détecte aucune aux incertitudes expérimentales près, ce qui 
veut bien dire que le photon incident isolé est passé soit sur la voie V, soit sur 
la voie V;,, mais jamais sur les deux à la fois : comme indiqué plus haut, on ne 
peut pas couper en deux un photon. 


+ Dans la deuxième série, on retire les compteurs de photons D, et D;, et on 
aligne l’interféromètre de Mach-Zehnder en recombinant les deux faisceaux V, 
et V; sur la lame L;,. On met un compteur de photons sur le faisceau de sortie, 
qui enregistre le signal N(6) résultant de l’accumulation pendant un temps T 
donné des comptages pour une différence de trajet 6 donnée. On change en- 
suite la Valeur de 6 et on répète l'expérience. La figure 10.10c donne le nombre 
de photons N(6) en fonction de & pour des valeurs de plus en plus grandes de T7. 
On constate qu’on voit apparaître peu à peu la variation sinusoïdale du signal 
en fonction de 6, démontrant comme dans le cas du biprisme le caractère à 
la fois ondulatoire et statistique des phénomènes liés à ces photons uniques. 
Mais la situation est nouvelle car on est maintenant sûr, grâce à l'expérience 
précédente, que le photon n’est passé que par un seul des deux chemins pos- 
sibles! 


Cette expérience illustre donc la propriété quantique surprenante, voire para- 
doxale, que le phénomène d’interférence se produit, non pas lorsque deux pho- 
tons se « retrouvent » après avoir pris des chemins différents, mais bien lors- 
qu’un seul photon « a le choix » entre deux chemins possibles. Le photon passe 
en quelque sorte « à la fois » par les deux chemins, de manière à être sen- 
sible à 6 et par un seul de ces chemins, pour ne pas donner lieu à comptage 
en coïncidence. On a ici une illustration du phénomène spécifiquement quan- 
tique d’interférence de chemin, où ce sont les différentes «histoires » possibles 
de la particule qui donnent lieu à interférence avec addition des amplitudes de 
probabilité correspondantes. 


4. À. Aspect, P. Grangier, G. Roger Europhysics Letters vol.1, p. 173 1986. 
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POLARISATION 

DE LA LUMIÈRE : 
ASPECTS CLASSIQUES 
ET QUANTIQUES 





11.1 DESCRIPTION CLASSIQUE 
DE LA POLARISATION 


Avant d'aborder la description quantique d’un faisceau lumineux nous allons préciser 
certaines propriétés classiques de la lumière liées au caractère vectoriel du champ 
électrique, qui se traduit par le phénomène de polarisation de la lumière. 


11.1.1 Onde électromagnétique et champ électrique 
transverse 


Considérons une onde plane lumineuse de pulsation & se propageant dans la direc- 
tion z. Cette onde consiste en un vecteur champ électrique oscillant, dont Maxwell a 
montré qu’il oscille dans une direction transverse à la direction de propagation de la 
lumière, donc dans le plan xOy. Tout vecteur de ce plan peut se décomposer sur une 
base de deux vecteurs unitaires ex parallèle à Ox et ey parallèle à Oy (figure 11.1). 





Figure 1 1.1- Onde plane lumineuse : oscillations des vecteurs champ électrique Éet 
TA — 
champ magnétique B. 


On peut donc, en toute généralité, décomposer le vecteur champ électrique sur 
cette base et écrire, en utilisant comme précédemment la notation complexe pour les 
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champs oscillants : 


E(z,n) = AneltPn en + Ayet#v De (11.1) 
. À re? 

= i(Kz—-wt) H | 112 

nt). (12) 


où A7, et Ay sont les amplitudes de l’onde selon les directions horizontales et verti- 
cales. On appelle polarisation de la lumière la trajectoire décrite par l’extrémité du 
vecteur champ électrique en un plan transverse donné (z = constante dans notre cas). 

On s’intéressera en particulier dans ce cours au cas de la polarisation linéaire, 
correspondant au cas où y = by = @. Un vecteur unitaire à coefficients réels suffit 
dans ce cas pour décrire le champ : 


E(z,n) = Age, (11.3) 
avec : 


Ep — G€H + fev 
a=An/A, B=Av/A, &+f=1 


_ 2 2 
A = 4/A2 + A2 (11.4) 


La trajectoire décrite par l’extrémité du vecteur champ électrique lors de son oscil- 
lation à la fréquence optique w est dans ce cas un segment de droite, de direction 
définie par le vecteur e,. Dans le cas particulier où Ay = 0 on parle de polarisation 
horizontale, et verticale pour le cas A7 = 0. La base dans laquelle on décrit le champ 
électrique n’est pas unique, et n’importe quelle rotation de la base {ex,ev} est une 
base possible. On utilisera souvent la base tournée à 45 °, définie par : 


| 1 
€45 — ——=€H + —=Ev 


v2 v2 
1 1 
C_45 = —— CH + —ev (11.5) 
v2 v2 
qui vérifie bien e45.e_45 = 0 (vecteurs orthogonaux) et e45.e45 = €e_45.e_45 = 1 
(vecteurs unitaires). La nouvelle base est bien orthonormée. 

De façon plus générale, à partir de tout vecteur ey = cos ex + sin dey on peut 
définir une base en lui adjoignant le vecteur e, = — sin #ex + cos dev. L’ensemble 
{es,e;} forme alors une base orthonormale directe du plan transverse. Ainsi, un vec- 
teur champ électrique quelconque comme celui défini à l’équation (11.3) peut se 
décomposer dans cette nouvelle base : 


E(z,t) = (E(z;t).es)es + (E(Z,t).e,)e, (11.6) 
.: E(z,t).es 
= ane). (11.7) 
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11.1. Description classique de la polarisation 


Mentionnons qu'il est aussi possible d’avoir des phases 4x et dy différentes dans 
l'expression (11.1) du champ. L’extrémité du vecteur champ décrit dans ce cas une el- 
lipse, et l’on parle de polarisation elliptique (circulaire si Ay = Ay). Les coefficients 
a et B de la décomposition du vecteur polarisation ep sont dans ce cas complexes, 
avec la restriction |a[? + lB? = |. Par souci de simplicité, nous nous restreindrons la 
plupart du temps dans ce chapitre au cas où ces coefficients sont réels et la polarisa- 
tion linéaire. 


11.1.2 Passage à travers un polariseur : loi de Malus 


Il existe dans la nature de nombreux matériaux dont les propriétés optiques dépendent 
de la polarisation, appelés biréfringents (indice dépendant de la polarisation) et di- 
chroïques (absorption dépendant de la polarisation). Ils permettent de sélectionner 
ou de manipuler la polarisation de la lumière, et nous en rencontrerons de nombreux 
exemples tout au long de ce cours. Considérons ici les polariseurs linéaires, qui sont 
des milieux absorbant la lumière oscillant selon une direction de polarisation et trans- 
mettant la lumière oscillant selon la direction orthogonale. Un cas particulier est le 
film polariseur formé de longues molécules alignées. Si on place un tel film sur le 
trajet d’un faisceau lumineux, alors seule la composante de polarisation dans la di- 
rection de l’axe passant (ou axe propre) du polariseur est transmise (figure 11.2). 





Figure 11.2 - Illustration de la loi de Malus : une onde lumineuse polarisée 
rectilignement (après passage d’une onde lumineuse quelconque dans un polariseur 
linéaire par exemple) traverse un polariseur (jouant le rôle d’analyseur) dont l’axe 
passant fait un angle 4 avec la polarisation de l’onde. En sortie, l’onde lumineuse est 
encore polarisée rectilignement, mais sa direction de polarisation est celle de 
l’'analyseur, et son amplitude est réduite car multipliée par un facteur cos®. 


Pour calculer le champ transmis, 1l faut alors l’exprimer dans la base de polarisa- 
tion définie par le polariseur. 

Considérons un polariseur « e, », dont l’axe propre est selon la direction e, et une 
onde lumineuse E;,(,f) incidente sur ce polariseur. L'expression du champ dans la 
base {es,e;} est donnée par l’équation (11.6). Le champ à la sortie du polariseur est 
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donc simplement : 
Eout(z;1) = (Ein(z,t).e9)eg (11.8) 


Dans le cas où le champ incident est polarisé horizontalement : 


EG = Aer 0) enr 
Eout(zst) = Ape +900 cos 0 ep (11.9) 
La puissance lumineuse est proportionnelle au carré du champ, donc en prenant le 


carré du module, on en déduit directement l’expression de la puissance de sortie en 
fonction de l’angle de rotation du polariseur et de la puissance d’entrée (figure 11.3) : 


Pour = COS” 6P; (11.10) 


C’est ce qu’on appelle la loi de Malus, qui décrit la puissance transmise par un pola- 
riseur linéaire en fonction de l’angle entre l’axe du polariseur et la polarisation de la 
lumière incidente. 


Pout/Pin = COS20 


0.5! 





L_ 


x/4 x/2 3x/4 7 





Figure 11.3 - Loi de Malus : le rapport entre puisssances transmise et incidente est 
égale à cos?6, où 4 est l’angle entre la polarisation de l’onde incidente et l’axe passant 
du polariseur. 


Mentionnons aussi dans cette section le cube séparateur de polarisation (fi- 
gure 11.4). Cet élément transmet une direction de polarisation et réfléchit à 90° la 
polarisation orthogonale. 

L'avantage par rapport au polariseur est que la lumière n’est pas absorbée, et que 
les deux directions de polarisation correspondant aux axes propres du cube sont dis- 
ponibles. Ainsi, si on note 1 et 2 les deux sorties de ce cube, alignées de telle sorte 
qu’elles correspondent respectivement aux polarisation horizontale et verticale, et 
qu’on injecte de la lumière polarisée telle que décrite dans l’équation (11.1), les deux 


162 


t © 2015 Dunod. 


Copyrigh 


© Dunod. Toute reproduction non autorisée est un délit. 
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Cube € 









séparateur de Faisceaux 

polarisation lumineux 
Faisceau lumineux atténués, de 
incident, de polarisation polarisations 


rectiligne : 


2] croisées 


Figure 11.4- Schéma de principe d’un cube séparateur de polarisation. 


champs à la sortie s’écrivent : 


Ei(z,6) = Ane (T9 en 
E)(z,f) _ Avelkztév-u)es, 


Dans le cas particulier d’un faisceau incident polarisé linéairement selon la direction 
ep(équation 11.3), les deux faisceaux à la sortie s’écrivent : 


E1(4,9 = Aeïk+9-0)(e .err)en (11.11) 
E(,1) = Ael+#-0)(e .ev)ey 


11.1.3 Association de polariseurs 


Nous venons de voir que pour décrire la propagation d’une onde électromagnétique il 
faut travailler dans un espace de dimension 2, alors que ce qu’on mesure, l’intensité, 
est un scalaire (c’est-à-dire un nombre). Cela mène parfois à des comportements 
extrêmement non intuitifs. Nous allons en voir ici un exemple. 





Figure 11.5 - Association de trois polariseurs dont les axes passants font, par rapport 
à l’axe horizontal, un angle de 0°, 4 et 63. 


Considérons le dispositif de la figure 11.5, où de la lumière est incidente sur un jeu 
de trois polariseurs successifs, « H », « 2 », « 03 ». Décrivons comme précédemment 
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le champ lumineux incident de manière générale : E;,(z,f) = An exp(—-i(wt — Kz + 
bn))en + Ay exp(—iwt — kz + by))ey. Le premier polariseur « H » étant aligné selon 
la direction horizontale, après ce polariseur la lumière peut être décrite par : 


E(z,n = Apeltt#n 01) en. 


Supposons tout d’abord que le deuxième polariseur n’est pas présent (ou qu’il est 
aligné avec le premier). En ce cas, la transmission par le 3° polariseur se décrit comme 
dans le paragraphe précédent, équation (11.10). La puissance transmise vaut donc 
P;3 = cos’ 03P1, où 63 est l’angle que fait le troisième polariseur avec l’horizontale. 
En particulier, lorsque les deux polariseurs, 1 et 3, sont croisés (1.e. que leurs axes 
sont orthogonaux), aucune intensité n’est transmise, les polariseurs absorbent toute 
la lumière. 

Partons de cette configuration, où le premier polariseur est horizontal, et le troi- 
sième vertical (43 = x/2). Toute la lumière est absorbée par le dispositif. Ajoutons le 
polariseur 2. Le champ après le premier polariseur est inchangé, le champ après le 
polariseur « 6: » est donc : 


E2(2,9) = ApelKt9n 0 cos Bep, . 


Le champ incident sur le troisième polariseur n’est donc plus polarisé orthogonale- 
ment à l’axe de ce polariseur. On peut calculer le champ transmis, il vient : 


E;(z,9 = Apelltôn 0) Cos 6: cos(x/2 — &)ey 
P3 = cos” 6 cos”(x/2 — 6)P1. (11.12) 


Ainsi, en particulier quand 6, = x/4, 13 = 11/4. On augmente la puissance transmise 
par le dispositif en rajoutant un élément absorbant ! Ce comportement tout à fait 
étonnant est directement lié à l’aspect vectoriel de la polarisation. 


11.2 DESCRIPTION QUANTIQUE 


Nous allons, dans cette section, donner une description qui permette de prendre en 
compte à la fois les aspects ondulatoires et corpusculaires de la lumière dans un même 
formalisme. La lumière se prête très bien à une description quantique directe, car le 
caractère ondulatoire est déjà décrit par les équations de Maxwell, il ne reste donc 
qu’à les rendre compatibles avec l’aspect probabiliste évoqué précédemment. Le for- 
malisme développé ici fournira une solide base de départ pour aborder la description 
de tous les autres systèmes physiques, et en particulier l’électron et l’atome. La des- 
cription quantique de la lumière est d’autant plus simple que les photons n’ont pas de 
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11.2. Description quantique 


masse et n’interagissent pas entre eux, ils sont donc parfaitement isolés de leur envi- 
ronnement et sont naturellement des systèmes quantiques très purs. Ainsi, c’est avec 
de la lumière qu'ont été réalisées pour la première fois la plupart des expériences de 
pensée imaginées par les fondateurs de la mécanique quantique. 


11.2.1 Effet d’un polariseur sur un photon 


Nous avons déjà effectué une première description quantique de la lumière au chapitre 
précédent en introduisant des probabilités au niveau de la détection et du passage 
dans une lame semi-réfléchissante et en reliant la probabilité de détection au carré du 
champ électrique. Il nous faut affiner cette approche pour y inclure les propriétés de 
polarisation. Nous considérerons ici uniquement des ondes planes, où la probabilité 
de détection ne dépend pas du point considéré pour faire apparaître uniquement les 
propriétés liées à la polarisation. Nous avons vu que celles-ci se manifestent dans un 
espace vectoriel de dimension deux. Nous verrons, dans le chapitre suivant, que toute 
la richesse de la théorie quantique apparaît dès que l’espace des états possibles est 
de dimension supérieure à un, et on pourra alors très simplement généraliser ce que 
nous faisons ici. 





Figure 1 1.6- Passage d’un photon unique, issue d’une onde lumineuse polarisée 
verticalement, à travers un polariseur dont l’axe passant fait un angle 4 avec 
l’horizontal. En sortie, l’onde lumineuse est encore polarisée rectilignement, mais sa 
direction de polarisation est celle de l’analyseur, et son amplitude est réduite car 
multipliée par un facteur cose. Cette réduction d'amplitude se traduit par une 
diminution de la probabilité de passage du photon en cos?4. 


Plaçons-nous dans le cadre de la figure 11.6, où un photon unique de lumière po- 
larisée verticalement est incident sur un polariseur « 4 ». Comme pour le cas de la 
lame séparatrice, il n’est pas possible de couper le photon en entités d’énergie plus 
faible : i/ va donc se produire un phénomène probabiliste au passage du polariseur, 
avec des probabilités non nulles de transmission ou d’absorption du photon, la pro- 
babilité devant être telle que la moyenne sur un grand nombre de détections donne 
la valeur classique, c’est-à-dire la loi de Malus. Ainsi, la probabilité de détecter un 
photon après le polariseur doit avoir pour valeur : 


Probay(1) = cos” 4. (11.13) 
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De manière plus générale, si la lumière incidente est polarisée linéairement selon la 
direction e, on a pour les photons composant cette lumière : 


Probag(1) = (ep.e9)-. (11.14) 


On voit que les probabilités de passage du photon à travers le polariseur sont données 
directement par le produit scalaire entre le vecteur polarisation incident et le vecteur 
représentant la direction de l’axe du polariseur. Ces deux vecteurs étant unitaires, on 
obtient bien un nombre compris entre 0 et 1, 1 n’étant obtenu que lorsqu'ils ont la 
même direction (mais pas forcément le même sens). 

On peut maintenant décrire les probabilités liées au passage à travers un cube sé- 
parateur de polarisation. Considérons simplement le cas où le photon incident est 
polarisé linéairement selon la direction e,,, et reprenons en termes de probabilité les 
résultats des équations (11.11). Il vient directement que : 


Probap, (1) = |ep.ex| 
Probap, (1) = |ep.ev/? (11.15) 


Comme e, est normalisé, on constate que Probap, (1) + Probap,(1) = 1, qui illustre 
P q 1 2 q 

qu’un seul photon est incident sur le cube et que ce dernier n’absorbe pas la lumière, 

il ne fait que l’aiguiller vers deux directions différentes en fonction de sa polarisation. 


11.2.2 État quantique de polarisation 


Pour décrire de manière commode les propriétés du photon, il faut faire appel à une 
notion complètement nouvelle, mais extrêmement puissante, celle d’état quantique, 
qui va nous permettre de décrire de manière unifiée les probabilités des résultats des 
différentes mesures que nous venons de trouver. 

La mécanique quantique postule que les objets mathématiques qui décrivent les 
photons appartiennent à un espace vectoriel : on les appelle vecteurs d’état du pho- 
ton. Cette propriété, valable pour tous les objets quantiques et pas seulement pour les 
photons, est à la base de beaucoup de propriétés étranges, mais confirmées par l’ex- 
périence, des objets quantiques. Le paragraphe précédent nous a montré que, pour 
décrire les propriétés de polarisation d’un photon unique, l’outil important est le vec- 
teur unitaire de polarisation. Nous allons donc nous inspirer de l’espace des vecteurs 
unitaires de polarisation pour décrire le vecteur d’état du photon. L'intérêt de com- 
mencer par la polarisation du photon est de tirer profit de l’analogie directe qui existe 
entre vecteur de polarisation et vecteur d’état. Nous verrons dans les chapitres sui- 
vants que la notion de vecteur d’état s’étend à des systèmes plus complexes et à des 
espaces vectoriels de dimensions plus importantes, où cette analogie directe n’existe 
plus, mais où les propriétés de base que nous allons introduire subsistent. 
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Nous postulons que dans le cas où l’on considère de la lumière se propageant 
selon la direction z, monochromatique et de pulsation w, l’état quantique du photon 
unique associé est parfaitement défini par son vecteur unitaire de polarisation. Nous 
introduisons les notations : 


Notation État quantique Vecteur unitaire équivalent 
_— I 
|H)  |Photon polarisé horizontalement eH = 0 
. . 0 
[V) Photon polarisé verticalement ey = | 





Le vecteur d’état quantique associé au photon est noté par le symbole |} qui 
contient un nom ou label formé de lettres ou de chiffres caractérisant l’état du photon. 
Il porte le nom usuel de ket, attribué par l’inventeur du vecteur d’état, Paul Dirac. La 
structure de l’espace mathématique des états quantiques est celle d’un espace vecto- 
riel, en l’occurrence l’espace des vecteurs polarisation. Ainsi pour un photon polarisé 
selon une direction e, quelconque, l’analogie entre vecteur d’état et vecteur polari- 
sation nous permet d’écrire le vecteur d’état Un) qui le caractérise sous la forme : 


ln) = alH)+BIV) où e,=() avec «+8 =1. (11.16) 


B 

Comme nous l’avons vu en début de section, les polarisations linéaires ne repré- 
sentent qu’une fraction des états de polarisation accessibles. Il suffit de considérer 
que les coefficients «& et B sont à valeurs complexes pour engendrer tout l’espace des 
polarisations possibles. L’état quantique le plus général pour un photon unique est 
donc : 


l) = alH)+B|V) où (aB)eC? et {al +18? =1. (11.17) 


11.23 Principe de superposition : espace de Hilbert 
des états de polarisation du photon 


La structure d’espace vectoriel que nous venons d’introduire implique un principe 
de superposition, selon lequel toute combinaison linéaire d'états d’un photon est 
encore un état possible pour le photon. Cette propriété d’apparence mathématique et 
technique a en fait de profondes conséquences physiques. 

L'espace vectoriel des états quantiques de polarisation du photon est muni d’un 
produit scalaire hermitien (hermitien car il concerne des vecteurs à coefficients com- 
plexes), qui est l’analogue du produit scalaire usuel des vecteurs polarisation. Le pro- 
duit scalaire hermitien de deux vecteurs d’états |) et |’) de composantes respectives 
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(&,B) et (a’,B) est noté {|”) et a pour expression : 
le) = aa +fFP (11.18) 
où “ dénote la conjugaison complexe. On a en particulier : 


(HIV)=0,  (HIH) = (VIV) = pl) = lp) = 1 (11.19) 


La base (|H),|V)) est donc orthonormée. 

On appelle espace de Hilbert un espace vectoriel à coefficients complexes muni 
d’un produit scalaire hermitien. Tous les systèmes quantiques isolés, aussi complexes 
soient-ils, peuvent être décrits par des vecteurs d’état appartenant à des espaces de 
Hilbert de dimensions très grandes, parfois infinies. Ils obéissent donc tous au prin- 
cipe de superposition que nous avons énoncé plus haut. 


11.24 Traversée d’un polariseur par un photon 


Le formalisme que nous venons d’introduire permet de décrire simplement les phé- 
nomènes de nature probabiliste qui se produisent lorsqu'un photon est incident sur 
un polariseur, à travers les postulats suivants : 


+ À tout polariseur « 4 », d’axe dirigé selon l’angle 6, est associé un état de polari- 
sation du photon spécifique, celui qui passe avec une probabilité unité à travers ce 
polariseur, c’est-à-dire celui dont la direction de polarisation est parallèle à l’axe 
du polariseur. Son vecteur d’état est |0) = cos 0H) + sin AV). 


e Lorsqu'un photon décrit par un vecteur d’état |) est incident sur un polariseur 
«0 », la probabilité Probaa(lf)) pour qu’il passe à travers le polariseur vaut : 


Probag(ly)) = Kb)? (11.20) 


e Dans le sous-ensemble des cas où le photon a été effectivement transmis, l’état 
conditionnel du photon à l’issue de la traversée du polariseur est |0), indépendam- 
ment de l’état du photon incident sur le polariseur. 


Il est facile de voir que les deux règles précédentes permettent de retrouver les proba- 
bilités (11.14) et (11.15) des paragraphes précédents, et le fait qu’une fois le polari- 
seur traversé, le photon se retrouve « intact » à sa sortie, c’est-à-dire dans l’état d’un 
photon transmis à coup sûr. 


11.2.5 Association de polariseurs 


Il est maintenant possible de calculer ce qu’il advient d’un photon après son passage 
à travers un jeu de plusieurs polariseurs. Considérons un photon unique Un) polarisé 
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selon e, incident sur deux polariseurs successifs « 4 » et « 4” ». La probabilité pour 
le photon de passer à travers le premier polariseur est donnée par l’équation précé- 
dente (11.20). Ce photon passé à travers ce polariseur est maintenant polarisé selon 
l’axe passant du polariseur, nous pouvons le noter |). La probabilité que ce photon 
passe à travers le second polariseur est donc | (4/10) 2 = les, .eol. Finalement, la pro- 
babilité de détecter le photon après les deux polariseurs est le produit des probabilités 


successives, soit : 
# 2 2 
Probäe,.ey (1) = le, .eol"le5.epl (11.21) 


Cette expression permet de retrouver les résultats du paragraphe 10.1.3, mais cette 
fois-ci concernant l’arrivée de photons isolés sur les polariseurs. 


> 
XENcarT 11.1 Nature de l'incertitude quantique 


Nous venons de voir que les photons polarisés à 45°, noté [45°), ont 50 % de 
chance d’être transmis à travers un polariseur « H », et 50 % de chance d’être 
absorbés. Considérons maintenant la lumière émise par le Soleil : le processus 
d'émission des photons à la surface du Soleil ne privilégiant aucune direction, 
elle est formée de photons polarisés rectilignement dans une direction 8 aléa- 
toire. Lorsqu'un photon solaire arrive sur le polariseur «H », il a une probabilité 
cos? 6 d’être transmis. L’angle 8 étant aléatoire, il faut moyenner cette probabilité 
sur tous les angles 8 possibles, ce qui donne une probabilité moyenne de trans- 
mission de 0,5. Les photons solaires ont donc, comme les photons polarisés à 
45°, 50 % de chances d’être transmis à travers un polariseur « H », et 50 % de 
chance d’être absorbés. 

Correspondent-ils pour autant au même état de la lumière ? Non, car les photons 
polarisés à 45° ont une probabilité unité d’être transmis par un polariseur «45° », 
alors que les photons de la lumière solaire ont encore 50 % de chances d’être 
transmis à travers ce polariseur, 50 % d’être absorbés. 


L’incertitude de polarisation des photons venant du Soleil vient du fait qu’on ne 
maitrise pas leur processus d'émission à la surface du Soleil, elle est liée à une 
préparation incomplète, probabiliste du système : on dit qu’il y a mélange 
statistique des états du photon. En revanche, le caractère aléatoire de la trans- 
mission d’un photon |45°) à travers un polariseur est fondamental car il n’est pas 
dû au fait qu’un ou plusieurs paramètres du système ne sont pas maîtrisés :onne 
pourra jamais connaître avec certitude si un photon donné sera transmis ou ab- 
sorbé. En effet, le physicien John Bell a montré que si on fait l'hypothèse inverse 
et qu’on suppose que l'incertitude quantique vient aussi du fait qu’on ne maiï- 
trise pas les paramètres hypothétiques, pour l'instant inconnus (d’où leur nom 
habituel de « variables cachées »), qui gouvernent la transmission ou l'absorption 
d’un photon par le polariseur, on en déduit une inégalité (connue sous le nom 
d’inégalité de Bell) que doivent vérifier les résultats de mesure. De nombreuses 
expériences ont montré que cette inégalité est systématiquement violée, et qu’il 
faut donc abandonner l’hypothèse des « variables cachées » à la base du raison- 
nement de J. Bell. Notons qu'il existe plusieurs types de variables cachées, et que 
seules les théories à variables cachées «locales » (c’est-à-dire définies localement, 
au moment de l'interaction photon-polariseur par exemple) sont concernées par 
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l'inégalité de Bell. La violation de cette inégalité n’exclut donc pas les théories à 
variables cachées non-locales, comme la théorie de de Broglie-Bohm!. 


L'incertitude quantique est donc intrinsèque et irréductible : il faut se résoudre à 
admettre une certaine limitation dans la prédictibilité des phénomènes physiques 
individuels dans le monde quantique. Fort heureusement, l’incertitude sur la pré- 
diction des phénomènes est de plus en plus faible lorsqu’on accumule un grand 
nombre de ces phénomènes, car la loi des grands nombres fait converger la fré- 
quence des évènements avec la probabilité donnée par les règles quantiques. 


1. Voir à ce sujet F. Laloë, Comprenons-nous vraiment la mécanique quantique ?, EDP Sciences, 2011. 
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SYSTÈMES 

À PLUSIEURS ÉTATS : 
NOTION D’ÉTATS 
QUANTIQUES 





12.1 ÉTATS QUANTIQUES 


Nous avons introduit au chapitre précédent le concept de vecteur d’état, avec sa nota- 
tion sous forme de ket introduite par Dirac. Ce vecteur d’état appartient à un espace 
vectoriel à coefficients complexes et permet de prédire tous les résultats de nature 
probabiliste concernant les mesures faites sur le système considéré. La puissance 
de la mécanique quantique réside dans la grande généralité de cette approche : ce 
concept peut être étendu à d’autres particules (électrons, protons) et à des systèmes 
composites, simples ou complexes, en faisant la liste des différents états possibles. 
Par exemple, pour une particule de masse non nulle comme l’électron, on introduira 
des états permettant de faire des prédictions sur sa position et sa quantité de mou- 
vement, son énergie, etc. Cette approche est très efficace pour des systèmes isolés 
dont la liste des états possibles est bien contrainte. Dès que le système est en interac- 
tion avec le monde extérieur, cette liste peut devenir gigantesque et il faudra utiliser 
d’autres outils et procéder à des approximations, mais cela n’entre pas dans le cadre 
de ce cours introductif. 

Nous allons, dans cette partie, considérer uniquement les grandeurs caractéris- 
tiques d’un système qui sont susceptibles de prendre seulement un ensemble dénom- 
brable de valeurs, car elles sont plus simples mathématiquement, et nous aborderons 
les grandeurs qui prennent un nombre continu de valeurs, comme la position d’une 
particule, dans le chapitre suivant. Dans le présent chapitre, pour une propriété don- 
née du système (polarisation, énergie, etc.) nous aurons une liste dénombrable de 
configurations possibles, que nous appellerons des éfats quantiques, en étendant ce 
que nous avons vu en dimension deux, pour la polarisation, à une dimension quel- 
conque pour toute grandeur physique dénombrable. 

La notion de dimension de l’espace des états est essentielle en mécanique quan- 
tique. Nous verrons qu’elle est mathématiquement très bien définie, mais on peut 
en donner une approche plus expérimentale. Pour l’exemple de la polarisation, nous 
avons vu que cet espace est de dimension deux. Qu'est-ce que cela signifie ? Sim- 
plement, deux états de polarisations suffisent à décrire tous les états, car un ket |W) 
quelconque se décompose de façon unique sur une base à deux dimensions. En quoi 
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des états peuvent-ils former une base ? Pour l’exemple de la polarisation, on a vu que 
si un photon est V (resp. H), et qu’on utilise un polariseur « H » (resp. « V »), on est 
sûr de ne mesurer aucun photon. Ces deux états peuvent donc être parfaitement dis- 
criminés expérimentalement : ils sont dits orthogonaux. On dira que ce sont les états 
propres de l’appareil de mesure constitué par le polariseur « H » car ils donnent une 
valeur sûre à la mesure de polarisation : la dimension de l’espace des états est donc 
le nombre minimum d’états orthogonaux ou exclusifs à partir desquels 1l est possible 
de décrire tout état quantique. 
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ENCART 12.1 Un autre système à deux états : le spin 3. Expérience de 
Stern et Gerlach 


L'une des expériences les plus emblématiques mettant en évidence un système 
à deux états est celle d'Otto Stern et Walther Gerlach, réalisée en 1922. L'idée 
était de mesurer le moment magnétique des atomes d'argent, lié à la rotation 
des charges dans l’atome, donc au moment cinétique de l’atome. Pour cela, ils 
ont produit dans une enceinte à vide un jet d’atomes d'argent. La source des 
atomes d’argent (un four chauffé et percé d’un petit trou) produit des atomes 
dont le moment magnétique est orienté dans des directions aléatoires, de la 
même manière que le Soleil produit des photons de polarisation aléatoire. Ces 
atomes passent ensuite dans un champ magnétique variant selon z (figure 12.1). 
En présence de ce champ magnétique non uniforme, ils subissent une force pro- 
portionnelle au gradient de champ magnétique et à la projection de leur moment 
magnétique selon la direction du gradient. Ils sont donc déviés par le disposi- 
tif, et cette déviation est mesurable en observant les points où s'accumulent les 
atomes sur l’écran. Le dispositif permet donc de connaître la projection du mo- 
ment magnétique de l’atome selon z. Cette quantité peut prendre a priori des 
valeurs continues car l'orientation du moment magnétique par rapport à Oz n'est 
pas fixée par le dispositif. 

Lors de cette expérience, Stern et Gerlach n’ont pas observé la distribution conti- 
nue attendue, mais seulement deux points d'impact symétriques par rapport à la 
déviation nulle, donc deux valeurs opposées de la projection du moment magné- 
tique. /l n’y a donc que deux valeurs possibles +us de la projection du moment 
magnétique de l'atome sur un axe donné, et ce quelle que soit l'orientation choi- 
sie pour cet axe : c’est ce qu’on appelle la quantification spatiale. L'appareil de 
Stern et Gerlach est donc pour les atomes l’exact analogue du polariseur pour 
les photons. 


Pour en rendre compte théoriquement on introduit une nouvelle observable quan- 
tique, le spin, permettant de décrire cette propriété. On lui associe deux vecteurs 
de base |+), et |-), décrivant respectivement un atome d’argent dévié à coup sûr 
vers la tache supérieure et inférieure, donc de projection du moment magnétique 
sur Oz égal respectivement à +u, et -up. L'espace de dimension deux associé au 
spin a exactement la même structure que celui de la polarisation et suit donc les 
règles exposées précédemment pour le photon. 


On montre, en outre, que les mesures de la projection du moment magnétique 
selon les directions z, x ou y obéissent aux même règles que les mesures de 
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polarisation du photon selon les directions {H,V}, {D,D}, ou circulaire gauche et 
circulaire droite, et on peut donc, par exemple, décrire l’état de l'atome dont la 
projection du moment magnétique de spin selon x vaut +, par le vecteur d'état 
H}x = (#2 +12). 

Le spin est la première quantité que nous rencontrons qui est de nature pure- 
ment quantique, car elle n’a pas d’équivalent classique. De manière générale, 
pour décrire toute particule élémentaire il est nécessaire de donner son spin. Les 
électrons ou les neutrons ont, comme l'atome d’argent, un spin dit « 1/2 », qui 
correspond à un espace de dimension deux, mais d’autres particules, qu’elles 
soient élémentaires ou composites, peuvent avoir des spins plus élevés, corres- 
pondant à un nombre plus grand de valeurs quantifiées possibles pour la mesure 
de la projection du moment magnétique sur un axe. Le spin d’une particule est 
une propriété qui rentre dans le cadre de la description quantique du moment 
cinétique, étude qui va au-delà du cadre de ce livre. 


Physique 
classique : ligne 
continue Observation : Atomes 
d'argent 





deux points 


Champ magnétique 
non homogène 


Figure 12.1- Schéma de principe de l'expérience de Stern et Gerlach : des atomes 
d'argent sont envoyés, à l’intérieur d’une enceinte à vide, dans l’entrefer d’un aimant 
où règne un champ magnétique variable le long de l’axe vertical, où ils subissent 
une force proportionnelle à la projection de leur moment magnétique sur cet axe. En 
physique classique, cette projection prend un ensemble continu de valeurs. 
L'expérience montre qu’en sortie, les atomes se regroupent en deux faisceaux, 
chacun correspondant à une valeur, quantifiée, de cette projection. 

(source libre : http://fr.wikipedia.org/wiki/Expérience_de_Stern_et_Gerlach) 
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12.2 MANIPULATION ET MESURE D’ÉTATS 
QUANTIQUES 


12.2.1 Le cadre mathématique 


Prenons pour l’instant le problème d’un point de vue abstrait, en suivant la procé- 
dure engagée dans le chapitre précédent. Supposons que nous soyons en présence 
d’un système isolé dont l’espace des états possibles est de dimension N. Rappelons 
que N = 2 pour la polarisation d’un photon ou le moment magnétique d’un atome 
d’argent (encart 12.1). Nous verrons en exemple un cas où N = 3 : les neutrinos. Un 
autre exemple est constitué par une cavité optique piégeant la lumière, dans laquelle 
les états possibles pour la lumière sont les états à nombre de photons donné, de zéro 
à quelques unités. 

Supposons que nous soyons capable d'identifier N états quantiques formant une 
base de cet espace. Cette base est notée {|} ,[V)} dans le cas de la polarisation du 
photon, et nous la notons {|ÿ,)}1=1.n dans le cas général. Dans le cadre de la polari- 
sation, l’état le plus général est combinaison linéaire des états |H) et [V). Ici encore, 
si notre système est dans un état inconnu |ÿ), 1l est possible de le décomposer sur les 
états de base : 


» fc, en) e C 


W)= D culyn) où 


n=1 


(12.1) 
le +...+lenf =1 


Les coefficients c; sont les coefficients complexes de la décomposition unique de 
lg) dans la base des états. L’ensemble des états possibles forme un espace vectoriel 
à coefficients complexes, aussi appelé espace de Hilbert, muni du produit scalaire 
hermitien : 


S1 (Y,) et |Ys) sont deux vecteurs de l’espace des états : 


la) = C1 1) + C2lW2) +... + cn IN) 
ls) = di li) + dif) +... + dx ln) (12.2) 


on définit le produit scalaire hermitien : 
(bblba) = cidi + cod +... + xd}, 


Pour un état physique, on impose aussi la règle de normalisation : 


lu) À = 1. 


12.2.2 Le principe de superposition 


La description précédente, inspirée de celle des états de polarisation, nous a amené à 
poser que tout vecteur d’état se décompose de façon unique dans la base des vecteurs 
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d'états. La réciproque est vraie : toute combinaison linéaire normée des vecteurs de 
base est un état quantique possible. 


S1 [f,) et If,) sont deux états quantiques possibles, alors 


M) = à la) + Blbo) où | (4) P = 1 


est un état quantique possible. 


Cette notion de superposition d’états est propre à la mécanique quantique, et elle 
reflète le caractère ondulatoire de cette théorie. En mécanique des particules clas- 
siques, cette notion n’existe pas. On la retrouve par contre pour les ondes classiques, 
qu’elles soient lumineuses, sonores ou autres, où elle est à l’origine des phénomènes 
d’interférences. La théorie que nous sommes en train de développer contient bien les 
ingrédients pour décrire les interférences observées expérimentalement, aussi bien 
pour la lumière que pour la matière. 


12.23 Introduction à la mesure dans le monde quantique 


Lorsqu'on a décrit les états possibles pour un système (sa polarisation, son énergie), 
cette liste d’états correspond à la liste des résultats possibles lors de la mesure de 
la quantité physique considérée. Pour la polarisation, nous avons vu que la liste des 
états possibles dépend du choix de l’appareil de mesure : horizontal (A) et verti- 
cal (V), ou diagonal (D) et anti-diagonal (D). D'ailleurs, dans notre description, la 
notion même de l’existence d’une base d’états quantiques est indissociable de l’exis- 
tence d’un appareil de mesure capable de discriminer entre ces différents états. C’est 
un cube polariseur et deux détecteurs dans le cadre de la polarisation. C’est un comp- 
teur de photons pour l’énergie du champ électromagnétique. Nous avons vu que la 
probabilité de détection d’un photon ayant une direction de polarisation donnée était 
égale au carré du module du produit scalaire entre l’état du photon et le vecteur pola- 
risation. En particulier, quand le photon est décrit dans la même base que l’appareil 
de mesure, ce sont directement les modules carrés des coefficients qui donnent les 
probabilités. 

Supposons donc que nous avons un appareil de mesure capable de discriminer les 
états de la base {|Y,)}1=1..n, c’est-à-dire qui donne la réponse certaine numérotée par 
n (que nous appellerons réponse n) si et seulement si on soumet à son examen l’état 
quantique |ÿ,). Nous postulons que la probabilité que la mesure sur un état physique 
|) donne la réponse n est : 


Probay)(l#n)) = | (nl) À = lc? (12.3) 


d’après la définition (12.1) et la règle du produit scalaire (12.2). On retrouve bien 
que le résultat de la mesure est certain si on envoie sur le détecteur un état [ÿ,,) : la 
probabilité vaut 1 sin’ =netOsin Æn. 
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Cette règle, dite règle de Born, est l’extension de la règle de projection sur un po- 
lariseur du chapitre précédent. Elle peut se généraliser : supposons qu’il existe un 
appareil de mesure capable de déterminer si le système est dans l’état |) et unique- 
ment dans cet état-là. Alors, la probabilité de détection sur ce détecteur à partir de 
l’état |Y), autrement dit la probabilité de détecter le système |[ÿ) dans l’état [y) est 
donnée par : 


Probay)(|x)) = | (xl) (12.4) 


Nous avons vu ici l’un des principes fondamentaux de la mécanique quantique, qui 
est que le résultat d’une mesure unique est aléatoire. Seules sont bien déterminées 
les probabilités de mesure, et donc les moyennes pour un grand nombre de mesures 
reproduisant à l’identique la même expérience. Attention, il est très important de ne 
pas confondre une série de mesures où on refait à chaque fois l’expérience complète 
sur des systèmes toujours préparés dans le même état quantique, comme nous venons 
de le considérer ici, avec plusieurs mesures successives effectuées toujours sur le 
même système comme nous allons le voir maintenant. 


12.2.4 Et si la mesure ne détruit pas l’état ? 


Nous avons pour l’instant décrit les probabilités d’apparition d’un « clic » sur le dé- 
tecteur de polarisation qui signale que le détecteur a observé et détruit l’état quantique 
en question. Cependant, il est possible d’imaginer, et de réaliser expérimentalement, 
des détecteurs permettant de mesurer une grandeur sur un système tout en ne le dé- 
truisant pas. Que devient alors le système après la détection ? En physique classique, 
la réponse est simple, du moins en théorie, puisque, l’interaction entre le système et 
le détecteur étant bien connue, on peut connaître exactement l’effet de la mesure sur 
le système et la prendre en compte pour son évolution future. Ce n’est plus le cas 
en physique quantique, à cause du caractère probabiliste des interactions au niveau 
microscopique. 


0 clic 


CD CD 


V): (V 
[D) (V) IH) (V) 
A AD 


Figure 12.2 - Mesures successives d’un photon polarisé diagonalement par deux cubes 
séparateurs de polarisation. Si le premier détecteur ne détecte rien, cela signifie que le 
photon est transmis. Il peut alors être décrit par le ket |H), et on est sûr de le détecter 
sur la voix H du deuxième cube. Ainsi, la mesure non destructive (absence de clic) nous 

donne une nouvelle description de l’état du photon, conditionnelle à cette mesure. 
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Supposons que le détecteur a caractérisé l’état du système en donnant la réponse n. 
Il semble raisonnable d’imposer que le même détecteur redonnera le même résultat 
n Si on répète la mesure sur le même système déjà mesuré. Utilisons une fois encore 
l’exemple de la polarisation du photon. Un détecteur partiellement non destructif est 
décrit en figure 12.2. Un cube séparateur de polarisation est placé sur le chemin d’un 
photon, et un seul compteur de photons est placé sur la voie réfléchie (polarisation 
verticale), la voie transmise est laissée libre. Ainsi, si le détecteur ne détecte rien, 
on sait que le photon a été transmis par le cube, et on a donc détecté un photon 
polarisé horizontalement. Que se passe-t-1l maintenant si on place un deuxième cube 
polariseur après le premier ? En optique classique, toute la lumière transmise par le 
premier cube est transmise par le deuxième (même polarisation). Comme la physique 
quantique doit refléter, aux grands nombres de photons, les résultats classiques, le 
photon transmis par le premier cube est forcément transmis par le deuxième, avec 
une probabilité un. L’état du photon après le cube est donc |A). 


Ce résultat est tout à fait remarquable. Partant d’un photon quelconque |ÿ), l’ab- 
sence de « clic » sur un détecteur change l’état du photon en |A). Cette modification 
drastique et irréversible de l’état quantique lors d’une mesure non destructive a beau- 
coup perturbé les scientifiques et les épistémologues. En fait, 1l faut bien comprendre 
qu’un détecteur non destructif est un système complexe avec beaucoup de degrés de 
liberté, sa description complète en est donc extrêmement difficile. Effectuer une me- 
sure à l’aide d’un détecteur, même idéal, implique des interactions entre le système 
et le détecteur qui modifient fatalement l’état quantique du système. 


Il faut aussi insister sur le fait que l’état après la mesure est conditionné par le résul- 
tat précis de cette mesure : ce n’est pas l’état du photon résultant de l’interaction avec 
l’appareil de mesure que l’on trouve de manière certaine après le premier séparateur 
de polarisation. C’est l’état dans lequel se trouve le photon dans le sous-ensemble 
de cas (dont on ne peut déterminer avec certitude quand ils vont se produire) où la 
mesure a donné le résultat O. 


12.3 APPLICATION À LA CRYPTOGRAPHIE 


Nous allons illustrer les propriétés fondamentalement nouvelles de la mesure au ni- 
veau quantique par un exemple où le caractère fondamental de l’incertitude quan- 
tique est mis à profit pour « cacher » de l’information. Il s’agit de la cryptographie 
quantique. 
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12.3.1 Carte de crédit quantique 


Commençons par un exemple simple conceptuellement mais éloigné de la réalité 
expérimentale, qui consiste à concevoir une carte de crédit dont on est sûr qu’elle ne 
peut être copiée, donc à sécurité absolue. 

Elle est formée de n boîtes contenant chacune un photon polarisé |H), [V}, [D}) ou 
|D), et donnée par la banque à son client. Par exemple, pour n = 4, la carte contient les 
photons (D), |H), |[H), |D)). Le lecteur de carte de la banque est formé d’une série de 
n polariseurs choisis parmis H,V,D,D dans un ordre connu d’elle seule, par exemple 
D,H,V,D, avec laquelle elle va mesurer de manière non-destructive le contenu de la 
carte lorsque le client voudra faire un retrait. Elle trouvera donc 0,1,0,0 et attribuera 
le retrait au compte repéré par ce numéro. Sa mesure aura pour effet de transmettre 
les photons dans les états mesurés, donc ne changera pas le contenu de la carte, car 
la banque a pris soin de mettre dans la carte des photons dont la mesure donne un 
résultat sans incertitude. 

Supposons maintenant qu’un malfaiteur ait la possibilité de mesurer le contenu 
de la carte, afin de la reproduire et d’utiliser la copie pour effectuer des retraits. Il 
faut donc qu’il mesure la polarisation des photons, mais il ne connait pas la série des 
polariseurs utilisés par la banque. Il utilisera par exemple les polariseurs H,V,D,D. 
Il trouvera bien l’état du deuxième et quatrième photon, mais obtiendra un résultat 
aléatoire pour le premier et troisième photon. Il n’aura donc l’état exact de la carte 
qu'avec une probabilité de 25 %. En outre, après la mesure, l’état de la carte aura 
changé car le premier photon sera maintenant |[H} ou |V), et le troisième |D) ou [D), 
et la lecture pirate de la carte sera décelée. 

Ce schéma est très loin d’une possible réalisation pratique (la « boîte à photons » 
qui les conserve pendant un temps infini n’existe pas encore actuellement), mais il 
illustre bien les possibilités ouvertes par les mesures sur deux différentes bases, c’est- 
à-dire par le principe de superposition quantique, et par le fait que la mesure affecte 
de manière fondamentalement incontrôlable l’état d’un système quantique. 


12.3.2 Théorème de non-clonage 


Notre malfaiteur est peut être très fort en physique : que se passe-t-il s’il dispose 
d’une machine qui permet de dupliquer un état quantique quelconque sans avoir à 
le mesurer ? Il pourra dans ce cas fabriquer une nouvelle carte de crédit identique à 
l’originale, un clone en quelque sorte, et faire des retraits sans être décelé. 

Fort heureusement, les lois de la mécanique quantique, et plus précisément le prin- 
cipe de superposition, interdisent l’existence d’une telle machine : c’est le fhéorème 
de non-clonage, dont la démonstration est extrêmement simple. 

Supposons en effet que la machine produise deux photons dans l’état X, soit l’état 
IX,X), à partir d’un photon |X), et deux photons dans l’état Y, soit l’état |Y,Y), à 
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partir d’un photon |Y). Le principe de superposition implique que si on lui injecte 
l’état |45) = (IX) + |Y))/ V2 la machine produira l’état (IX,X) + [Y,Y)}/ V2). Il est 
facile de voir que cet état n’est pas le clone de |45). En effet, le clone de |45) est 
l’état : 


145,45) = ((IX) +17) V2, (X) + 1")y/ V2) 
= (IX,X)+1Y,7)+ IX, 7) +[Y,X))2 


La carte de crédit quantique est donc bien incopiable, non pas pour des raisons 
de difficulté technique comme c’est le cas actuellement, et qui peuvent être remises 
en question par d’éventuels progrès de la technique, mais pour des raisons liées aux 
fondements de la mécanique quantique. 


12.3.3 Quelques notions de cryptographie 


L'objet de la cryptographie est de transmettre de manière parfaitement confidentielle 
un message entre deux opérateurs. Ce message peut être représenté par un code 
binaire. À titre d'exemple supposons que nous souhaitions transmettre le message, 
certes un peu abscon, 011000. Comme il est impossible de s’assurer d’une parfaite 
confidentialité des lignes de communications, l’idée est qu’Alice code le message, et 
que Bob soit le seul à pouvoir le décoder. Deux stratégies principales sont à l’œuvre : 


e cryptographie à clé publique : c’est la stratégie mise en œuvre dans les transmis- 
sions sécurisées sur Internet par exemple. Elle repose sur des principes mathéma- 
tiques fondamentaux. Bob choisit deux nombres premiers n, et m, et les multiplie 
n = nñn; X M. Il envoie de manière publique ce produit à Alice. Alice utilise une pro- 
cédure mathématique! pour coder le message avec le nombre n. Cette procédure 
est telle qu’il est impossible de retrouver le message d’origine sans connaître les 
facteurs n, et n2. La sécurité repose alors sur la difficulté de factoriser le nombre 
n, l'algorithme le plus efficace, connu pour factoriser les grands nombres en ses 
facteurs premiers, étant exponentiellement complexe. Donc la sécurité ne dépend 
que du temps de calcul nécessaire pour retrouver la clé de déchiffrement, qui croît 
exponentiellement avec sa longueur ; 


e cryptographie à clé privée : dans ce cas, on suppose qu’Alice et Bob sont les seuls 
à partager une clé, qui est idéalement un nombre de la même taille que le message 
à transmettre. Supposons par exemple que ce nombre est 110011. Alice fait alors 
l’addition bit à bit : 
011000 
&110011 
= 101011 


1. R. L. Rivest, A. Shamir, and L. Adleman, Com. of the ACM 21, 120 1978, R. L. Rivest, A. Shamir, 
and L. Adleman, « Cryptographic communications system and method » (1983), US Patent 4,405,829. 


179 


Dunod. 


2015 


Copyright € 


Chapitre 12 + Systèmes à plusieurs états : notion d’états quantiques 


Elle envoie le résultat à Bob. Ce dernier, avec sa clé peut faire l’opération inverse et 
retrouver le message. La sécurité ici repose donc sur la possession de clés secrètes, 
et le problème est donc transféré au partage confidentiel de ces clés. 


Il existe de nombreux protocoles classiques, dont le protocole RSA universelle- 
ment utilisé de nos jours dans les transmissions sécurisées d’informations sur le 
web et qui est basé sur la difficulté de factoriser de très grands nombres. Sa sécurité 
n’est pas absolue, car rien n’interdit qu’une méthode plus rapide de factorisation 
soit trouvée un jour et rende ce code obsolète. 


12.3.4 Cryptographie quantique 


La cryptographie quantique n’a pas les défauts précédents : comme la carte de crédit 
quantique, elle procure un moyen parfaitement sûr - au moins dans son principe - de 
transférer ces clés secrètes. 

Nous n’entrerons pas dans ce paragraphe dans le détail de la procédure, décrite 
dans de nombreux ouvrages et abordée dans l’encart 12.2. Elle est basée, comme 
pour la carte de crédit, sur l’utilisation des deux bases (H,V) et (45,-45) pour mesurer 
la polarisation des photons échangés. Tout espion qui a connaissance des messages 
échangés qui permettent de construire la clé est immédiatement détecté car les règles 
de la mécanique quantique impliquent, comme dans le paragraphe précédent, qu’il 
modifie nécessairement ces messages, et donc que sa présence peut être détectée. La 
sécurité du système n’est ainsi pas une conséquence, comme c’est le cas pour toutes 
les autres méthodes de cryptage, de la complexité de la procédure. Elle est assurée 
par les lois même de la mécanique quantique. 

La cryptographie quantique est maintenant sortie des laboratoires de recherche : on 
peut trouver dans le commerce des appareils de cryptage quantique fonctionnant sur 
des distances de plusieurs kilomètres. On a ainsi sécurisé en 2007, par un dispositif 
de cryptographie quantique, la transmission des données électorales du canton de 
Genève. 


SEncarr 12.2 Le protocole de cryptographie quantique BB84 


En 1984, Bennett et Brassard? ont proposé un protocole d'échange de clés se- 
crêtes basé sur l'échange de photons uniques polarisés, que nous allons rapide- 
ment expliciter ici. Ce protocole se décompose en trois étapes : génération d’une 
clé, transmission, réconciliation. 


1. Génération d’une clé secrète 


Pour que le protocole fonctionne, Alice doit disposer d’une source parfaite de 
nombres aléatoires. Pour ce faire elle utilise un des principes de base de la 


2. C. H. Bennett and G. Brassard, « Proceedings of the IEEE International Conference on Computers », 
Systems and Signal Processing, nï 175, Bangalore, India 1984. 
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mécanique quantique, qui dit que toute mesure est intrinsèquement aléatoire. En 
envoyant alors un photon unique sur un lame séparatrice, on à 50 % de chances 
pour le mesurer transmis et 50 % de chances de le mesurer réfléchi. On associe le 
zéro à la première situation et le un à la deuxième, et on obtient alors une suite 
parfaitement aléatoire de zéros et de uns comme décrit en figure 12.3. 


SPU 





cube 50/50 


Figure 12.3 - Protocole de génération de nombres parfaitement aléatoires : une 
source de photons uniques (SPU) envoie des photons sur une lame séparatrice, telle 
que le photon a exactement 50 % de chances d’être transmis ou réfléchi. Une chaîne 

aléatoire de 0 et de 1 est ainsi générée à partir de ces photons : O0 si le photon est 

mesuré transmis, 1 s’il est mesuré réfléchi. La nature aléatoire du phénomène est 
intrinsèque puisque assurée par les lois de la mécanique quantique. La réalisation 
expérimentale n’est néanmoins pas parfaite, et un biais dans la lame séparatrice ou 
une efficacité moindre des deux détecteurs peut dégrader l’aspect aléatoire du 
phénomène. En pratique, donc, ce type de générateur nécessite une calibration 
extrêmement précise. 
(source : S. Tanzilli, LPMC, Université de Nice) 


2. Transmission de la clé 


Alice code la clé sur des photons uniques polarisés. Par exemple, elle choisi d’'at- 
tribuer la valeur 0 au photon polarisé horizontalement : |H), et la valeur 1 à celui 
polarisé verticalement : |V). Elle envoie donc une succession de photons à Bob, 
qui fait une mesure sur la base {H,V} et peut donc reconstruire le message. Ce- 
pendant, cette technique ne suffit pas à assurer la sécurité de la transmission. En 
effet, supposons qu’un espion, traditionnellement appelé Eve (de l'anglais eaves- 
dropping), cherche à intercepter le message. Si Eve choisit de faire une mesure 
dans la base {H,V}, elle Va détruire le photon mais pourra connaître exactement 
ce qui a été envoyé par Alice. Elle peut donc envoyer le même photon à Bob, 
passant ainsi inaperçue. 

L'aléatoire en mécanique quantique arrive quand la base de mesure n’est pas 
celle où est construit l’état. Ainsi, si Eve faisait la mesure sur la base {D,D} 
elle ne pourrait connaître parfaitement l’état. Pour assurer la sécurité de la 
transmission, Alice doit donc choisir de manière parfaitement aléatoire la base 
sur laquelle elle encode le message, pour qu'Eve ne sache pas sur quelle base 
elle doit mesurer. En pratique, elle choisit entre la base {H,V}, où [H) est associé 
à O et |V) est associé à |, et la base {D,D}, où |D) est associé à O0 et D) est 
associé à 1. Ce choix se faisant là encore en utilisant un générateur de nombres 
aléatoires quantique! Ainsi, Eve ne sait pas sur quelle base elle doit faire la 
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mesure. Si elle se trompe, le photon renvoyé sera différent du photon qu’elle a 
reçu, et sa présence pourra être détectée. Cependant, Bob non plus ne sait pas 
sur quelle base faire sa mesure. Comment alors s’assurer de la transmission du 
message ? 


3. Réconciliation 


Le protocole complet est décrit sommairement sur la figure 12.4. Alice choisit 
aléatoirement la base sur laquelle est codé le message. Bob, à la mesure, choisit 
également aléatoirement, car il n’a aucune connaissance des choix faits par Alice. 
Il a donc une chance sur deux d’avoir choisi la bonne base. Après l'échange 
complet effectué, Bob indique donc à Alice, de manière publique, quelles bases 
il a utilisé pour faire ses mesure, et Alice lui indique dans quels cas il a bien 
choisi, et donc Alice et Bob ne conservent que les nombres correspondants au 
choix communs de bases. Alice et Bob partagent alors une clé aléatoire de taille 
en moyenne moitié de celle de départ. 





Bob 
Filtres polarisants B D. 
verticaux, Alice 3se h/Av étecteur «0, 
horizontaux et ü 0 
diagonaux | e) 
t ENT N * Re, «1» 
-e- Base +45° 
Source 8 
photons Bits d'Alice UE L'O OQUE6 0 € OL 
PERS Bits de Bob 9 © © © 9 © © © © © © © 
Résultats de Bob 0 1 0 - 0 1 0 1 1 - 10 
Clef Es de D Es © 0€ € 


Figure 12.4 - Protocole de cryptographie BB84 : Alice code ses qbits aléatoirement 
sur l’une des deux bases complémentaires de polarisation. Bob choisit une base de 
lecture, qu’il communique après coup à Alice. Seuls les bits d’information 
correspondant aux bases communes sont conservés. 


Quel est l'intérêt de cette procédure complexe ? Comme nous l'avons vu, si un 
espion, Eve, tente d’intercepter le message, elle ne sait pas quelle est la base 
propre de mesure. En essayant d'observer, elle va donc introduire des erreurs, 
en moyenne pour un bit sur deux. Alice et Bob vont donc tenter de déceler la 
présence d’un espion en examinant les erreurs de transmission. Pour cela, il 
choisissent un sous-ensemble des bit échangés, qu'ils rendent publics (ils ne font 
plus alors partie de la clé!) et comparent. Si ces bits sont identiques, cela signifie 
que personne n’a intercepté le message, le reste de la clé est donc sûr. Sinon, 
en fonction des différences ils peuvent évaluer la probabilité de la présence d’un 
espion, et garder ou non la clé échangée. 

Est-ce que cela fonctionne vraiment dans la pratique ? Oui. Mais c’est un peu plus 
compliqué. Tout d’abord, le protocole précédent se fait au prix d’une perte im- 
portante des bits échangés, et surtout permet de détecter un espion mais ne dit 
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pas comment s’en affranchir. Les protocoles modernes permettent, en évaluant 
le taux d'erreur, de connaître la quantité d'informations maximale recueillie par 
l’espion. Avec des protocoles d'augmentation de la confidentialité, il peuvent 
alors construire une clé secrète avec les bits leur restant, au prix là encore d’une 
perte importante, mais même en présence d’espion ils peuvent échanger une clé 
aléatoire. 


De nombreuses expériences ont récemment mis en œuvre ce protocole en utili- 
sant du codage d’information sur divers paramètres quantiques et non unique- 
ment sur la polarisation du photon. Des appareils de cryptographie quantique 
sont même commercialisés? et ont déjà servi pour des opérations de démons- 
tration. Le marché reste néanmoins pour l'instant assez petit, mais qui sait, si 
un jour les physiciens développent un ordinateur permettant de factoriser les 
grands nombres en un temps court, alors pourront-ils vendre beaucoup plus ef- 
ficacement leurs protocoles de cryptographie quantique ? 


12.4 ÉVOLUTION DES ÉTATS QUANTIQUES 


Jusqu’à présent, nous avons décrit les systèmes quantiques à un instant donné, en 
expliquant comment l’utilisation d’un espace de Hilbert, inspiré de ce qui se passe 
pour la polarisation de la lumière, permet de rendre compte des mesures faites à cet 
instant. Néanmoins, rien n’a encore été dit sur l’évolution de ces états, ce que nous 
allons faire ici. Appuyons-nous une fois encore sur l’analogie avec l’optique et une 
des règles de base de la dualité onde-particule : £ = ñw, et considérons une onde 
lumineuse monochromatique de pulsation w. Nous avons vu qu’elle peut s’écrire 
sous la forme complexe À exp (—i(wt — kz)). Le facteur temporel est ici e-iw!, On peut 
donc écrire, de manière empirique, que l’évolution de l’onde associée au photon est 
le facteur multiplicatif e'E/}, C’est cette expression que nous allons généraliser ci- 
dessous. 


12.4.1 Représentation matricielle de l’énergie et équation 
de Schrôüdinger 


a) Évolution temporelle 


Soit un état quantique décrit à f = 0 par le ket [Yÿ£), « état propre » de l’énergie de 
valeur propre E. Ceci signifie que si on effectue une mesure idéale de l’énergie sur ce 
système on est sûr à 100 % de trouver la valeur E. 


3. Plusieurs entreprises proposent ou développent des solutions, On peut citer ID quantique (Suisse), 
http://idquantique.comm, MagiQ Technol. (USA), http:/www.magiqtech.com/, SeQureNet (France), 
http://www.sequrenet.fr/, Auréa Technol. (France), http://aureatechnology.fr/, NuCrypt (USA), http:// 
www.nucrypt.net/, Qu'Iools (Allemagne), http://www.qutools.com/, QuintessenceLabs (Australie), 
http://qlabsusa.com/. 
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Nous posons comme principe qu'à tout instant t ultérieur, l’état du système s'écrit : 


We (0) = EM lye) . (12.5) 


Ce postulat est compatible avec l’évolution temporelle en e-“” = e-E/ de l’onde 
lumineuse complexe introduite dans les chapitres précédents. 

Supposons que nous connaissions tous les états {|Y,)}1=1...» qui donnent une valeur 
bien définie Æ, à une mesure d’énergie (nous verrons en section 13.2 comment on 
peut trouver ces états dans un cas particulier). À 1 = 0 le système se trouve dans un 
état quelconque | (f = 0)), c’est-à-dire qu’il n’est pas nécessairement un état dont 
l’énergie est bien définie (ce qui peut paraître surprenant si l’on garde en tête une 
image classique du système, une particule par exemple). Comme les états propres de 
l’énergie forment une base, il existe donc des coefficients c, tels que : 


WG = 0)) = Ÿ cn Wa) : (12.6) 


n 


L'espace des états quantiques étant vectoriel, tout comme d’ailleurs l’espace des 
ondes monochromatiques en optique, l’évolution temporelle peut se décomposer sur 
celle des états propres de l’énergie, et on a donc de façon générale : 


WG) = D cne En lg) . (12.7) 


n 


Ainsi, chaque composante c, [Y,) d'énergie bien définie E, évolue avec le coefficient 
complexe e”‘E{/", Insistons sur le fait que les coefficients e-/Æ"f/" sont à l’intérieur de 
la somme précédente et ne peuvent donc pas être mis en facteur de celle-ci (à moins 
que toutes les énergies Æ, soient égales). 


b) Équation d'évolution associée 


Maintenant que l’on a pu décrire de manière générale l’évolution d’un état quantique, 
il est possible de dériver l’équation différentielle associée. Reprenons tout d’abord 
ce qui se passe pour un état propre de l’énergie, et dérivons par rapport au temps 
l’équation (12.5), 1l vient : 

2e) = ElÿE). (12.8) 

Ôt 

L'évolution d’un état quantique, état propre de l’énergie, est directement gouvernée 
par l’énergie du système. Ce fait peut être mis en relation avec ce qui se passe en 
mécanique classique, où par exemple la vitesse d’une particule est directement reliée 
à son énergie totale. 
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Cette équation se généralise comme dans le paragraphe précédent. Ainsi, en déri- 
vant l’équation (12.7) on trouve : 


mn EN GE,W). (12.9) 
ot n 

C’est cette équation qui régit l’évolution de tout vecteur d’état lorsque l’on connait 

les propriétés d’énergie du système. 

En fait, l’écriture précédente reste encore spécifique, car elle n’est utile que si l’on 
connait les états propres de l’énergie. La représentation matricielle de l’énergie va 
nous permettre de mettre à jour une version plus générale de l’équation d’évolution : 
l'équation de Schrüdinger. 


c) Représentation matricielle et équation de Schrôüdinger 


La structure de l’espace de Hilbert est une structure naturellement vectorielle. Ainsi, 
si on considère que l’on connait une base du système physique {|Y,)}1=1.N, on sait 
que tout état quantique peut s’écrire de la forme : y) = », cy [W). Connaissant cette 
base, la donnée d’un vecteur d’état est donc complètement équivalente à la donnée 
des coefficients complexes c,. On peut donc formellement l’écrire sous la forme d’un 
vecteur colonne de dimension N : 


C1 
C2 

Wa) = |. (12.10) 
CN 


On revient ainsi à la notation d’origine, celle de la polarisation, mais généralisée à 
N dimensions. Cette notation permet de réaliser facilement toutes les opérations de 
la mécanique quantique. Par exemple, le produit scalaire hermitien, que nous avons 
introduit en section 12.2, s’écrit comme un produit de matrices lignes et colonnes si 
on introduit la notation duale : {| = (c,c5,...,c9). Pour deux vecteurs d’état ÿ,) 
et |ÿy) il vient : 


c1 
(bla) = id, .….,4u).| : [= D dicr (12.11) 
CN 


On retrouve bien la formule du produit scalaire. 
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Cette représentation trouve tout son intérêt pour exprimer de façon générale l’équa- 
tion d’évolution (12.9). Le terme de droite de l’équation peut s’écrire comme le pro- 
duit d’une matrice et d’un vecteur. En effet, introduisons la matrice : 


Ey 0.4 0 

A 0 E …. 0 

H=|. , .. (12,12) 
0 O0 ... Ex 


qui est une matrice diagonale, dont les coefficients diagonaux sont les énergies 
propres du système. Il vient, en multipliant cette matrice par le vecteur d’état : 


Ei Des 0 C1 Eici 

” Q: Æy ::: 0 C2 Ec2 

Abel. + … . lle + [Sem (12.13) 
8 : . : 


0: 0 .:.E N CN ENCN 
Cette équation, que l’on peut écrire sous la forme condensée suivante : 


Ro Lg. (12.14) 
ot 
est l’équation centrale de la mécanique quantique : elle est appelée « équation de 
Schrôüdinger » . 

Son interprétation complète dépasse le cadre de ce cours, mais nous pouvons néan- 
moins en dire quelques mots. La matrice À s’appelle le Hamiltonien, et représente 
l’énergie du système. On peut montrer à partir des expressions (12.7) et (12.9) que 
l’équation précédente est indépendante de la base choisie. Cela signifie que si on ex- 
prime le vecteur d’état sur une base qui n’est pas celle des états propres de l’énergie, 
on peut encore utiliser cette équation à condition bien entendu d’exprimer le Hamil- 
tonien dans cette même base. 


12.4.2 Oscillation de neutrinos 


L'une des illustrations les plus marquantes, ces dernières années, de la mécanique 
quantique en dimension finie est celle de l’étude des neutrinos émis par le Soleil et 
détectés sur Terre. Comme nous l’avons vu dans la partie relativité de cet ouvrage, 
une réaction de fusion élémentaire se produisant dans le Soleil met en jeu quatre pro- 
tons qui, après une réaction en chaîne exothermique produisent un noyau d’hélium, 
deux positrons et deux neutrinos électroniques. Le neutrino, particule introduite pour 
satisfaire la conservation de l’impulsion lors de réactions nucléaires (section 7.4.4), 
est longtemps resté un mystère pour les scientifiques. En effet, la théorie ne donne pas 
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d'indication précise sur sa masse, mais en fournit simplement une limite supérieure : 
si elle est différente de zéro elle est forcément faible. Expérimentalement, le neutrino 
est incroyablement difficile à détecter, réagissant très peu avec la matière : sur Terre, 
il arrive environ 50 milliards de neutrinos par em? et par seconde, sans que nous 
ne nous en apercevions ! Les scientifiques ont donc cherché dans les années 1960 à 
mesurer ces neutrinos, en utilisant leur interaction, faible mais non nulle, avec des 
protons. Pour cela, ils ont utilisé des réservoirs contenant de gigantesques quantités 
de liquide, souvent à base d’eau. On citera en particulier l'expérience Homestake aux 
États-Unis, réalisée dans un réservoir contenant 40 m° de perchloroéthylène, liquide 
riche en chlore, élément interagissant plus facilement que les autres avec les neutri- 
nos. Ou encore l'observatoire Super-Kamiokande au Japon, construit dans une mine, 
et constitué d’un réservoir contenant environ 50 000 tonnes d’eau pure, entouré de 
plus de 11 000 photomultiplicateurs (figure 12.5). On trouvera un descriptif de l’en- 
semble des expériences ayant servi à cette aventure scientifique à l’adresse Internet 
http://en.wikipedia.org/wiki/Solar_neutrino_ problem. 





Figure 12.5 - Observatoire Super-Kamiokande au Japon. Le réservoir central contient 
50 tonnes d’eau dans lesquels baignent plusieurs milliers de photomultiplicateurs (les 
demi-sphères brillantes sur la figure). 

(Source : http://www-sk.icrr.u-tokyo.ac.jp/sk/gallery/index-e.html) 


Pourquoi répéter de si nombreuses et coûteuses expériences ? La raison est que dès 
les premières mesures effectuées par l’expérience Homestake, les scientifiques ont 
remarqué que seul un tiers des neutrinos prévus par la théorie était détecté. Ce déficit 
étant largement supérieur à l’incertitude sur la valeur attendue, il est donc devenu 
une énigme que de nombreux physiciens ont cherché à résoudre. Ce n’est que dans 
les années 1980 que la réponse fut claire, mais dès 1968 un physicien italien, Bruno 
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Pontecorvo, proposa une explication basée sur la masse des neutrinos, explication 
étayée ensuite dans le modèle standard, et confirmée expérimentalement en 1998 
(Raymond Davis Jr. et Masatoshi Koshiba reçurent le prix Nobel de physique 2002 
pour la détection des neutrinos solaires). 

Nous avons vu dans ce cours tous les éléments permettant de donner une explica- 
tion simple à ce phénomène. Le concept est directement ancré dans le problème de 
l’évolution temporelle des états quantiques d’un système physique. L'idée des physi- 
ciens fut de dire que si on ne détectait qu’un tiers des neutrinos électroniques prévus 
par la théorie, c’était que, pendant leur trajet depuis le Soleil, ils avaient changé de 
nature, pour devenir des neutrinos muonique ou tauique. Plusieurs hypothèses per- 
mettent d'arriver à cette conclusion. Tout d’abord, on suppose que les trois types de 
neutrinos sont trois états quantiques d’un même système physique, premier système 
de dimension trois que nous rencontrons. Ensuite, il est nécessaire de supposer que 
ce ne sont pas des états propres du Hamiltonien À, correspondant à la mesure de 
l'énergie du système. En effet, si le neutrino électronique était un état propre de À 
alors il resterait, lors de son évolution temporelle, un neutrino électronique, comme 
nous venons de le voir dans la section précédente. 

Ainsi, nous sommes en présence de deux bases de dimension trois pour le même 
système physique. Tout d’abord la base des états du neutrinos intervenant dans les 
réactions nucléaires, que nous noterons : 





Ve), lu) , |)  neutrinos intervenants dans les réactions nucléaires. 
(12.15) 
D'un autre côté, 1l existe la base des états propres de l’énergie, que nous noterons : 


[v1), [v2), [v3), états d'énergies respectives E1, ÆE3, E3. (12.16) 


Chaque état d’un neutrino peut donc se décomposer dans la base des états propres de 
l'énergie : 


ve) = @1 V1) + @2[v2) + a3 lv) 
bu) = B1 11) + Ba 1v2) + B3 13) 
[vr) = 111) + Y2lv2) + y3 lv3) (12.17) 


avec des coefficients à;, B; et y; a priori complexes. 

Regardons maintenant l’évolution temporelle d’un neutrino émis par le Soleil. Au 
moment de l’émission il s’agit d’un neutrino électronique, son état quantique s’écrit 
donc |#(f = 0)) = [v,). D’après le principe de l’évolution temporelle, on a donc pour 
tout instant ultérieur : 





GO) = are 11) + ae 7 la) + ae 0 fs) (12.18) 
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Au temps 7, de l’ordre de 8 mn, auquel le neutrino arrive sur Terre, la probabilité 
de détecter un neutrino électronique s’écrit : 


PT) = | ll )) À 
= (ai vil + a5 (vil + a3 (31) 
(je ET |) + ae EM |y,) + age EM |) 


ET à la Pe ET + ose Es TP (12.19) 


= |læiFe 
En développant cette dernière expression, et en regroupant les termes exponentiels 
sous forme de cosinus, on trouve finalement : 


PT) = ef + le + las 
+2lalla2l cos((E1 — E2)T/f) 
+2la[lasl cos((E — E3)T/h) 
+2la3/lail cos((E3 — E1)T/h) (12.20) 


On voit que cette probabilité évolue en fonction du temps et oscille au rythme des 
différences d’énergie, avec une amplitude dépendant des poids dans la décomposi- 
tion. Expérimentalement, le fait qu’on n’observe qu’un tiers des neutrinos à l’arrivée, 
donc pour T = 8 mn, donne des renseignements à la fois sur les coefficients de la 
décomposition et sur les énergies propres. L'hypothèse de départ est ainsi confir- 
mée : les neutrinos électronique, muonique et tauique ne sont pas des états propres de 
l’énergie. De plus, on peut en déduire des bornes inférieures sur les différences entre 
les énergies des états propres. Enfin, cette expérience a aussi permis de confirmer que 
les neutrinos ont une masse différente de zéro. 

Cette analyse a été brillamment confirmée en 2001 à l’observatoire de Sudbury 
au Canada. Dans cette expérience, 1000 tonnes d’eau lourde (formée de molécules 
d’eau dont l’hydrogène est remplacé par du deutérium) et quelques milliers de tonnes 
d’eau légère furent utilisées pour mesurer à la fois le nombre total de neutrinos et le 
nombre de neutrinos électroniques. 
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ONDES DE MATIÈRE : 
UNE INTRODUCTION 
À LA FONCTION 
D’ONDE 





À l'instar de la lumière et de son double comportement ondulatoire et particulaire, 
et aussi étrange que cela puisse paraître, la matière, dont on a de bonnes raisons de 
penser qu’elle est formée de particules ponctuelles, peut également présenter un as- 
pect « onde ». Un électron, un neutron, un atome, ou même une grosse molécule peut 
ainsi se comporter comme une particule bien localisée, voire ponctuelle, mais aussi 
comme une onde répartie dans l’espace, et donner lieu à des phénomènes typique- 
ment ondulatoires (interférences, diffraction, ondes évanescentes, etc.). 

L'aspect ondulatoire de la matière permet d’expliquer un très grand nombre de phé- 
nomènes, primordiaux comme la stabilité des atomes et de la matière et la conduction 
électrique, ou plus exotiques, comme la condensation de Bose-Einstein et la supra- 
conductivité. Les applications sont multiples (diodes à effet tunnel, transistor, lasers, 
microscopie électronique, nanolithographie, horloges atomiques...). L'efficacité pré- 
dictive de la théorie quantique de la matière, dont nous allons présenter les bases 
dans ce chapitre, s'accompagne de questionnements profonds qu’une telle dualité ne 
manque pas de soulever : comment en effet ces deux aspects onde et particule sont-ils 
reliés ? De quel type sont ces ondes de matière ? À quelles équations obéissent-elles ? 
Les réponses que la mécanique quantique apporte à ces questions font appel aux no- 
tions que nous avons introduites dans le chapitre précédent, mais aussi à des notions 
nouvelles, comme la fonction d’onde ou les inégalités de Heisenberg, que ce chapitre 
et le suivant vont s’attacher à présenter, d’abord de façon simple (le présent chapitre) 
puis de façon plus précise et détaillée (chapitre 14). 


13.1 ONDE DE MATIÈRE 
13.1.1 L'idée de Louis de Broglie 


Louis de Broglie a l’intuition en 1924 que, de même qu’à l’onde lumineuse est asso- 
ciée une particule, le photon, de même à toute particule matérielle doit être associé 
un phénomène ondulatoire, dont il ne précise pas la nature exacte. Il utilise « dans 
l’autre sens » les relations qui lient les propriétés caractéristiques de l’onde lumi- 
neuse à celles du photon (équation 10.4). 
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Nous postulerons donc qu’à toute particule de masse m, d'énergie E et de quantité 
de mouvement p est associée une onde de pulsation wyg et de vecteur d’onde Kg 
donnés par : 


E P 
= — ; kyp=— 13.1 
WAB = + dB (13.1) 
La constante commune qui permet de passer des propriétés ondulatoires (w,k) aux 
propriétés corpusculaires (E,p) est la constante de Planck réduite h = h/2xr = 


1074 J.s. 


On déduit de la deuxième relation (13.1) l’expression de la longueur d’onde de 
l’onde de matière en fonction de la vitesse v de la particule, appelée relation de de 
Broglie : 

AB = LL (13.2) 
mu 
La matière étant décrite comme un phénomène ondulatoire, il y a donc possibilité 
d’interférences pour les particules, et en particulier d’interférences destructives : 
ainsi, de même que « de la lumière plus de la lumière peut donner de l’obscurité » 
(section 10.4), « de la matière plus de la matière peut donner une absence de ma- 
tière » ! 


13.1.2 Ordres de grandeur, descriptions classique 
et quantique 


La dualité onde-corpuscule défie généralement notre intuition car nous avons du mal 
à la percevoir à notre échelle, d’autant plus pour la matière dont les attributs clas- 
siques habituels (solidité, présence de bords...) semblent inconciliables avec une des- 
cription ondulatoire. Il est donc impératif de comprendre quelles sont les conditions 
d'observation de cet aspect « onde » pour la matière. La relation de de Broglie se ré- 
vèle alors particulièrement utile pour déterminer si, dans tel ou tel contexte, l’aspect 
ondulatoire d’un objet physique est prédominant par rapport à son aspect corpuscu- 
laire. 

De façon intuitive, on comprend aisément qu’un objet matériel se comportera d’au- 
tant plus comme un corpuscule que l’onde de de Broglie qui lui est associée sera bien 
localisée, c’est-à-dire qu’elle occupera une zone très réduite de l’espace (de façon à 
pouvoir attribuer à l’objet une position et une trajectoire bien définies). Cette situa- 
tion est en fait très similaire à ce qui se passe pour la lumière lorsque l’on cherche 
les conditions pour lesquelles elle apparaît sous forme d’un rayon lumineux. C’est la 
fameuse approximation de l'optique géométrique, valable lorsque la longueur d’onde 
de la lumière est petite par rapport à la taille caractéristique des objets avec lesquels 
elle interagit. Dans le cas contraire apparaît le phénomène de diffraction, d’autant 
plus prononcé que le milieu parcouru par la lumière présente des variations (de taille, 
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Figure 13,1- Schéma montrant la diffraction d’un faisceau lumineux parallèle de 
longueur d’onde 1 par une fente de largeur d. La dispersion angulaire, en sortie de la 
fente, est de l’ordre de A4 = 4/d. Lorsque 1 < d, le faisceau de sortie (en pointillés) est 

formé de rayons parallèles : c'est l’approximation de l'optique géométrique. 


d'indice optique...) importantes sur une distance de l’ordre de quelques longueurs 
d'onde. 

Par exemple, lorsque l’on fait passer un faisceau lumineux parallèle à travers une 
fente de largeur 4 (figure 13.1), on observe que la lumière en sortie présente une 
dispersion angulaire A6 de l’ordre de 1/d. On constate alors que ce phénomène de 
diffraction est d’autant plus marqué que 1/d est grand. Dans le cas contraire (À € d), 
on retrouve bien les conditions de l’optique géométrique : la lumière en sortie de la 
fente se présente sous la forme d’un faisceau lumineux collimaté de largeur d. 

Dans le cas des particules de matière, cette situation revient à comparer la lon- 
gueur d'onde de de Broglie Ayg à la taille caractéristique d des objets avec lesquels 
elle interagit (ou, de façon plus rigoureuse, avec la longueur typique de variation du 
milieu dans lequel elle évolue). Si Ag < d, on retrouve la condition de l’optique 
géométrique, c’est-à-dire qu’une description classique du mouvement de la particule 
sera suffisante, à des corrections de l’ordre de Ayg/d près. Dans le cas contraire (38 
supérieure à, ou de l’ordre de, d), l’aspect onde de la particule prédominera et l’on ne 
pourra pas se contenter d'utiliser la mécanique classique pour décrire, même grossiè- 
rement, les phénomènes (ondulatoires) observés : il faudra nécessairement utiliser la 
mécanique quantique (voir, par exemple, sur les figures 13.2, 13.3 et 13.4, les phéno- 
mènes de diffraction et d’interférences de neutrons). 

Écrite sous la forme mvd > h, la condition Ayg € d montre que la constante de 
Planck joue un rôle similaire à la vitesse de la lumière en relativité restreinte : en effet, 
comme on l’a vu dans la première partie de ce livre, une description non-relativiste 
d’un phénomène (comparaison de mesures de durées ou de longueurs, effet Doppler, 
dynamique et collisions de particules...) est suffisante lorsque les vitesses en jeu sont 
négligeables par rapport à la vitesse de la lumière. 

Par exemple, est-il nécessaire d'utiliser la mécanique quantique pour décrire le 
mouvement (très lent !) d’un escargot ? Non, bien sûr ! La longueur d’onde de de 
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Figure 13.2 - Schéma de l'appareil utilisé par le groupe de A. Zeilinger en 1988 pour 
étudier l’aspect ondulatoire d’un faisceau de neutrons. La partie située à gauche de la 
fente F4 permet d'obtenir un faisceau parallèle et monocinétique de neutrons. Lorsque 
la zone diffractante F4 correspond à une fente unique, on observe, après la fente F5 en 
zone de sortie de l’appareil, la figure de diffraction 13.3. Lorsque l’on dispose deux 
fentes en F4, on observe la figure d’interférences 13.4. 
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Figure 13.3 - Diffraction d’un faisceau de neutrons de 44 = 19,3 À par une fente de 
90 um de largeur (figure 13.2 pour la configuration expérimentale). Comme attendu, la 
dimension de la tache centrale de diffraction est supérieure à la largeur de la fente. On 

observe également, de chaque côté de la tache centrale, des franges typiques de 
diffraction par une fente. Les points sont expérimentaux mais la courbe continue 
correspond à la prévision théorique. Le carré noir correspond à la largeur de la fente, 
c'est-à-dire à l’image géométrique du faisceau. (source : A. Zeilinger, R. Gähler, C.G. Shull, 
W. Treimer, and W. Mampe, Reviews of Modern Physics, vol. 60, 1988) 


let 


. ., a) . _ 
Broglie associée est en effet de h/mv = 7.107*° m (pour une vitesse de 1 mm.s 
une masse de 10 g), évidemment très inférieure aux diverses longueurs caractéris- 


tiques du problème (taille de l’escargot, des herbes ou des obstacles qu’il rencontre 
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Figure 13.4 - interférences neutroniques. La configuration expérimentale est la même 
qu'en 13.2, excepté qu’il y a maintenant deux fentes de largeur 22 um (espacées de 
104 ym) en zone F4. Les carrés noirs correspondent aux deux fentes. (source : A. 
Zeilinger, R. Gähler, C.G. Shull, W. Treimer, and W. Mampe, Reviews of Modern Physics, 
vol. 60, 1988) 


sur son chemin). Une description quantique du problème n’apporterait que des cor- 
rections relatives de l’ordre de 107? aux résultats classiques ! 


Au contraire, dans le cas de l’électron d’un atome d’hydrogène (masse & 107% ke, 
énergie typique = 10 eV, taille caractéristique = 0,1 nm), on obtient Ag = 0,5 nm 
qui est du même ordre de grandeur que la longueur caractéristique du problème. 
On en conclut qu’une description classique de l’électron d’un atome hydrogène est 
totalement insuffisante et qu’une description quantique est nécessaire dans ce cas. 


La relation (13.2) indique que la longueur d’onde de de Broglie est d'autant plus 
grande que la masse de la particule est faible et que sa vitesse est faible. On sait par 
ailleurs que, pour réaliser des interférences (lumineuses ou acoustiques par exemple), 
il faut contrôler les trajets parcourus par les ondes qui interfèrent à une fraction de 
longueur d’onde près. Pour une vitesse de 1 m.s”! par exemple, la longueur d’onde de 
de Broglie vaut 6.10 m pour un petit objet macroscopique comme une poussière 
de 1 ug, et on ne pourra donc pas observer d’interférences avec ces objets, a fortiori 
lorsqu'ils sont encore plus massifs. Par contre, toujours pour une vitesse d’1 m.s”!, 
cette longueur d’onde vaut 0,4 m pour un neutron et 0,7 mm pour un électron. Ainsi, 


si la source de particules les produit avec une vitesse suffisamment bien définie (donc 
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que l’onde associée est suffisamment monochromatique et de direction donnée), on 
pourra espérer observer de telles interférences. 

La relation (13.2) montre aussi que si v — O0, alors À7g — co. Il semble donc que 
pour observer des interférences de matière, il suffit d’utiliser des particules au repos, 
même macroscopiques. C’est sans compter sur l’agitation thermique qui empêche 
tout objet d’être exactement au repos, sauf à une température T nulle. On montre en 
thermodynamique que la vitesse moyenne d’agitation thermique vyerm d’une parti- 


cule de masse m vaut : 
[k8T 
Ufherm = nn. (13.3) 
m 


où kg = 1,38.1072 J.K-! est la constante de Boltzmann. On en déduit une longueur 
d’onde de de Broglie thermique : 


h 
AdB,therm = AmET 
mKB 


qui vaut à température ambiante (T = 300K) 3.107!° m pour la poussière ; 0,05 nm 
pour un atome de sodium de masse atomique 23 ; 0,2nm pour le neutron et 11 nm 
pour l’électron. On aura donc une longueur d’onde de l’ordre du nanomètre à tempé- 
rature ambiante avec des électrons, à 10 K avec des neutrons, à 1 K avec des atomes, 
mais toujours pas avec des particules macroscopiques, les plus basses températures 
obtenues à l’heure actuelle sur de tels objets étant de l’ordre du mK. 

Une remarque pour finir cette partie. Selon l’argument précédent, on pourrait pen- 
ser qu’il est nécessaire d’utiliser une description quantique des molécules de dihy- 
drogène du vide interstellaire au vu de la très faible température du milieu (3 K)... 
Mais il n’en est rien car la densité du gaz d’hydrogène est si faible que la distance in- 
termoléculaire est de l’ordre du centimètre, c’est-à-dire bien supérieure à la longueur 
d’onde de de Broglie Ayg,rherm de l'hydrogène à cette température (qui est de l’ordre 
du nanomètre). Une description classique du vide interstellaire est donc suffisante, à 
de petites corrections quantiques près. 


(13.4) 


13.1.3 Expériences 


De très nombreuses expériences d’interférence et de diffraction ont été réalisées avec 
des ondes de matière, confirmant l’hypothèse de de Broglie. Elles utilisent des dis- 
positifs analogues à ceux qui ont été développés pour observer les interférences lu- 
mineuses, comme les trous d’Young, l’interféromètre de Michelson (chapitre 2) ou 
le biprisme de Fresnel (chapitre 10). De nombreuses expériences utilisent la diffrac- 
tion par un réseau, c’est-à-dire par une structure périodique dans l’espace : dans cette 
configuration (figure 13.5) les différentes ondes diffractées par les éléments pério- 
diques de la structure interfèrent constructivement uniquement dans des directions 
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Figure 13.5 - Diffraction d’un faisceau lumineux par un réseau périodique de fentes. 
Le champ transmis, somme des champs diffractés par chacune des fentes du réseau 
périodique de période d, se renforce par interférence constructive uniquement dans des 
directions 4 = 6,, obéissant à la condition de Bragg sin, = nà/d (n entier) où la 
différence de phase entre les faisceaux diffractés est un multiple de 2x. Si l’on place un 
écran à une grande distance du réseau, on observera une figure de diffraction similaire 
à celle de la figure 13.6. 


bien définies. Plus précisément, une onde monochromatique incidente de longueur 
d’onde À donne naissance à une onde diffusée dont l'intensité est maximale selon un 
ensemble discret de directions 4 = 8, telles que sin®, = nZ/d, où n est un nombre 
entier et d la période spatiale de la structure diffractante (figure 13.6). Les irisations 
que l’on observe par exemple à la surface d’un disque, vinyle ou DVD, sont dues à 
la diffraction de la lumière sur les sillons gravés sur la surface de celui-ci dans des 
directions dépendant de la longueur d'onde. 

La première expérience à avoir confirmé l’hypothèse de de Broglie a été réalisée 
par Davisson et Germer en 1924. Ils utilisèrent un faisceau d’électrons interagissant 
avec le réseau des atomes régulièrement disposés dans un monocristal de Nickel et 
observèrent que les électrons étaient diffusés par le cristal dans les directions pré- 
dites par la formule ci-dessus avec À = Ag. Depuis, de nombreuses expériences 
ont confirmé la réalité des ondes de matière. De telles expériences de diffraction 
et d’interférence de matière sont maintenant régulièrement utilisées pour sonder les 
propriétés de solides ou de surfaces variées. 


Les interférences de matière sont observées non seulement avec des particules élé- 
mentaires comme les électrons ou les neutrons, mais aussi avec des objets composites 
et complexes, comme les atomes ou les molécules. Jusqu’à quel niveau de complexité 
un objet microscopique donne-t-il lieu à interférence ? En 2006, une équipe à Vienne 
a observé des interférences avec la molécule de C60F48, de masse 1 600 fois celle 
d’un nucléon, et de dimension de l’ordre de la dizaine de nm (figure 13.7). Il faut 
donc se rendre à l'évidence expérimentale : des molécules complexes, avec de très 
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Figure 13.6 - Diffraction d’un faisceau de molécules de sodium après leur passage à 
travers un réseau de fentes de 100 ym de large. Le dispositif expérimental est 
sensiblement le même que pour la diffraction neutronique : une zone de préparation, 
une zone de collimation (pour créer un faisceau de molécules), une zone diffractante (le 
réseau), et une zone de détection. Les petits cercles représentent le nombre de 
molécules détectées à différentes distances du centre du faisceau. La ligne continue 
correspond au résultat théorique de diffraction de l’onde de matière associée. (équipe 
de D. Pritchard du MIT à Cambridge, USA). 

(source : http://www.learner.org/courses/physics/visual/visual.htmlshortname=atom waves) 


nombreux degrés de liberté, ont l'étrange propriété de « passer » simultanément par 
des chemins différents pour interférer constructivement ou destructivement en sortie 
de l’interféromètre. 

On peut alors imaginer et réaliser toute une gamme d’appareils (polariseurs, mi- 
roirs, cavités, fibres, hologrammes...) pour reproduire, avec les ondes de matière, ce 
que l’on sait faire avec les autres types d’onde, en particulier avec les ondes lumi- 
neuses. Au domaine classique de la physique constitué par l’« optique lumineuse » 
ou optique photonique s’est récemment ajouté un domaine en rapide essor : l'optique 
atomique (le mot atomique devant être compris au sens large, c’est-à-dire décrivant 
tout type de matière). La longueur d’onde de de Broglie dépendant de la masse mn, 
les interféromètres atomiques sont très sensibles aux effets inertiels et gravitationnels 
dont ils forment des capteurs extrêmement performants. 


13.1.4 Nature statistique de l’interférence de matière 


Lorsque des particules materielles pénètrent une à une dans un interféromètre, on 
observe en sortie des impacts qui se répartissent spatialement de manière aléatoire, 
exactement comme ce qui se passe pour les photons de la figure 10.9. Ce n’est que si 
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Figure 13.7 - Principe de l’interféromètre à ondes de matière utilisé pour réaliser des 
interférences de grosses molécules à Vienne en Autriche (molécules de fullerène 
C60 F40). Après traversée des deux grilles préparatrices et de la grille diffractante, 

chacune des molécules est détectée en un endroit précis (par un signal de fluorescence 

par exemple). Progressivement, on observe que le lieu de ces impacts forme un 
interférogramme, comme celui de la figure de droite. 


on accumule un très grand nombre de particules que l’on voit se dessiner de plus en 
plus nettement la figure d’interférence : comme pour la lumière, on peut considérer 
que l’onde de matière « guide » en quelque sorte la particule. 

L'expérience de N. Tonomura en 1989 constitue l’une des plus belles illustrations 
de cet aspect statistique des interférences à ondes de matière (figure 13.8). Des élec- 
trons sont en effet envoyés, un par un, sur un biprisme électronique (un filament 
chargé entre deux électrodes planes) qui dévie différemment les trajectoires des élec- 
trons selon qu'ils passent à gauche ou à droite du fil. Ce biprisme sert en fait de 
« séparatrice électronique », c’est-à-dire qu’il joue le rôle des fentes dans l’expé- 
rience de Young ou celui du biprisme de Fresnel pour les interférences lumineuses 
(section 10.4). Sur le détecteur, en sortie, apparaissent alors des impacts dont la posi- 
tion semble aléatoire. Progressivement, cependant, on observe (figure 13.8) que ces 
impacts se répartissent de façon ordonnée, en bandes périodiquement espacées.…. ce 
sont les franges d’interférences électroniques ! 

Cette expérience est l’exact analogue de celle que nous avons décrite pour les 
photons au chapitre 10. 

Plus récemment, en 2012, l’équipe de M. Arndt a pu visualiser cette construction 
progressive des franges d’interférences pour des molécules (voir le film, d’où sont 
tirées les images de la figure 13.9, de cette construction à l’adresse Internet : www. 
quantumnano.at/far-field-mode.3953.html). On peut ainsi aujourd’hui « voir» en 
temps réel se construire, atome par atome ou molécule par molécule, des franges 
d'interférences de matière. 
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—— "1 À 
Detector | | a 
Figure 13.8 - Figure de gauche : principe de l’expérience d’interférences électroniques 
« électron par électron » de N. Tonomura en 1989. C'est un biprisme électronique qui 
joue le rôle du biprisme optique du chapitre 10. Figure de droite : construction 
progressive des interférences électroniques. Le nombre d'électrons détectés est de 8 (a), 
100 (b), 3000 (c), 70000 (d). 
(Source : http://www.aps.org/units/fed/newsletters/fall2010/zollman.cfm) 
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Figure 13.9 - La dualité onde-corpuscule visible en temps réel! Construction 
progressive (de « a » à «e ») d’interférences de molécules de phtalocyanine (C32Hig8Ng, 
masse égale à plus de 500 fois la masse d’un neutron) après passage à travers une 
grille de taille nanométrique (dispositif expérimental similaire à celui de la figure 13.7). 
Ces images sont tirées du film réalisé par l’équipe de M. Arndt en 2012 (film disponible 
à l’adresse Internet : www.quantumnano.at/far-field-mode.3953.html). 


13.1.5 Introduction de la fonction d’onde 


Comment décrire mathématiquement l’onde de matière introduite par de Broglie ? 
C’est Schrôdinger qui réalisa cette avancée capitale, avec l'introduction en 1926 de 
la fonction d'onde W(x,t), fonction complexe de l’espace et du temps, et de l’équa- 
tion qui porte son nom. En fait, Schrüdinger introduisit cette onde sans expliciter 
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son lien avec les grandeurs observables, tout comme Fresnel introduisit une fonction 
d’onde lumineuse sans connaître sa signification physique exacte, bien avant qu’on 
sache qu'il s'agissait d’un champ électromagnétique. Il s’avère en effet que l’onde 
ÿ(x,f) associée à tout objet physique n’est pas du même type que l’onde d’un champ 
classique, comme le champ électromagnétique ou le champ de pression de l’onde 
acoustique. 

Il revient à Born d’avoir donné le premier, en 1926, l'interprétation de la fonction 
d’onde en termes de probabilité : son module au carré | (x,0Ë donne la densité de 
probabilité de trouver à l'instant l’objet physique à la position x. Plus précisément, 
la probabilité P de trouver la particule à l'instant au point de coordonnée x telle que 
X1 < X < X2 à pour expression (on ne considère ici qu’une seule dimension d’espace 
pour simplifier, mais la généralisation à trois dimensions est immédiate) : 


8e [ dxlé D (13.5) 


Il en résulte la condition de normalisation : 


[ dx, nl = 1 (13.6) 


oo 


qui n’exprime rien d’autre que le fait que la particule se trouve nécessairement 
quelque part dans l’espace, la somme des probabilités devant donc être égale à un. 





Figure 13.10 - Dessin illustrant la dualité onde corpuscule et l'interprétation 
probabiliste de la fonction d'onde y (x). L'onde complexe y est bien localisée dans 
l’espace (en termes techniques, c'est un « paquet d’ondes »). La longueur d'onde de 
de Broglie 4 correspond à sa période spatiale moyenne. Sous l’onde ÿ sont représentées 
quelques occurrences différentes (disques rouges) de la particule décrite par une telle 
fonction d'onde. L’opacité des disques correspond à la densité de probabilité de 
présence |ÿ (x)2. 

(Source : http://en.wikipedia.org/wiki/Wave_particle_duality (mai 2012)) 
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La fonction complexe #(x,f) est ainsi une « onde de probabilité », et le lien onde- 
particule est de nature probabiliste. Cette interprétation permet en particulier d’expli- 
quer les expériences décrites dans la section précédente. Elle est l’exact analogue de 
ce que l’on a vu dans le chapitre 10 pour le photon : la probabilité de le trouver en 
un point donné est proportionnelle au module carré de l’onde lumineuse complexe. II 
y à donc une certaine parenté entre l’onde lumineuse complexe A(x,f), qui nous ren- 
seigne sur la probabilité de présence d’un photon unique et la fonction d’onde y(x,f) 
qui nous renseigne sur la probabilité de présence de la particule considérée. 

La forte analogie entre mécanique quantique du photon et mécanique quantique de 
la matière et de l’électron, déjà contenue dans les relations introduites par de Broglie, 
ne doit toutefois pas être poussée trop loin. Elle est plus ténue dès lors qu’on s’inté- 
resse à un faisceau lumineux contenant beaucoup de photons... De plus, le photon 
n’est pas une particule comme les autres : sa masse est nulle et sa vitesse est tou- 
jours c. Il en résulte que les équations d’évolution de l’onde lumineuse et de l’onde 
de matière sont différentes. Enfin, comme son énergie de masse mc? est nulle, le pho- 
ton est une particule qui peut être facilement créée ou détruite, alors que ce n’est pas 
le cas pour l’électron et toute autre particule matérielle. 

Dans le chapitre 12, nous avons indiqué dans les postulats généraux qu’à tout sys- 
tème physique était associé un vecteur d’état appartenant à un espace de Hilbert. C’est 
évidemment aussi le cas pour une particule matérielle. Il nous faut donc faire le lien 
entre la fonction d’onde d’un système matériel Y(x,r) et son vecteur d’état |7(f)). 
C’est l’objet de l’encart 13.1. Même si ces deux objets sont reliés, 1l faut prendre 
garde à ne pas confondre le vecteur d’état |7(f)), vecteur dans l’espace abstrait des 
états de la particule (espace de Hilbert), avec la fonction d’onde Y(x,f), fonction com- 
plexe de la variable x, dont l’ensemble des valeurs constitue les « coordonnées géné- 
ralisées » du vecteur d’état sur la base continue {|x}} définie dans l’encart. 


13.2 QUANTIFICATION DE L'ÉNERGIE 
POUR UNE PARTICULE CONFINÉE 


Une propriété capitale des systèmes ondulatoires est l’existence de cavités résonantes 
pour ces ondes. Nous avons vu, par exemple, les cavités optiques pour la lumière, 
formées de miroirs qui se font face, dans le chapitre 10, et l’exemple des cordes 
vibrantes et des tuyaux d’orgue pour l’acoustique est bien connu : ces dispositifs ont 
pour point commun de n’entretenir que des ondes dont /a fréquence ne prend qu'un 
nombre discret de valeurs. En effet, il n’y a interférence constructive entre toutes 
les ondes lors de leurs réflexions multiples sur les parois de la cavité que pour des 
fréquences bien déterminées. Nous allons voir que c’est aussi le cas pour les ondes 
de matière, et grâce à la relation E = hv, la quantification des fréquences entraînera 
pour les systèmes quantiques la quantification de l’énergie. 


202 


2015 Dunod. 


Copyright € 


© Dunod. Toute reproduction non autorisée est un délit. 


13.2. Quantification de l’énergie pour une particule confinée 


13.2.1 Boîte quantique à une dimension 


Pour simplifier l’analyse, nous supposons que la particule, de masse m, ne peut se 
déplacer que le long de l’axe Ox, et nous nous plaçons à un instant f donné. Entre 
les points d’abscisse 0 et Z, elle n’est soumise à aucune force, mais rencontre en 
ces deux points des « murs » infranchissables (figure 13.11). Nous verrons dans le 
paragraphe 13.2.4 comment réaliser en pratique de tels dispositifs. 


V=0 V=o 





0 L x 


Figure 13.11 - Puits de potentiel infini. Le potentiel est nul à l’intérieur du puits (entre 
x=0et x= L)et infini en dehors. 
(Source : http://fr.wikipedia.org/wiki/Particule_dans_une_boîte) 


Classiquement, la particule est libre entre x = 0 et x = L, donc sa vitesse v est 
constante. La particule inverse le signe de sa vitesse lorsqu'elle rencontre l’un des 
deux murs, sur lesquels elle « rebondit » élastiquement. Son énergie est uniquement 
cinétique E = mv°/2. E peut donc prendre n’importe quelle valeur positive, et sa plus 
petite valeur possible est 0 (particule au repos en un point quelconque entre 0 et L). 

Décrivons maintenant la particule par sa fonction d’onde quantique. La probabilité 
de trouver la particule en dehors de l’intervalle [0,4] est nulle, quelle que soit son 
énergie cinétique, d’où : 


ÿY(x <0) =y(x > L)=0 (13.7) 
Nous postulerons que la fonction d’onde (x) est continue, on a donc : 
ÿ(x = 0) = y(x = L)=0 (13.8) 


Nous cherchons ici une fonction d’onde décrivant une particule de vitesse, donc 
de longueur d’onde de de Broglie, donnée. La condition précédente impose une an- 
nulation de cette onde en deux points : on est dans une situation analogue à celle de 
la corde vibrante retenue en ses deux extrémités (condition dite d’onde stationnaire). 
Poursuivant l’analogie, on considère une solution sinusoïdale du type sin (27x/Au8) 
ou cos (27x/Ayg), où la longueur d’onde de de Broglie ÀA78 apparaît naturellement. 
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Comme elle doit s’annuler en x = 0, c’est nécessairement un sinus, et comme elle 
doit s’annuler en x = L, on doit avoir : sin (27 L/Ayg) = 0, donc : 


AB 
de =L n=1,2,… (13.9) 
c’est-à-dire qu'il ne peut y avoir qu'un nombre entier de demi-longueurs d’onde entre 
0 et L. 
Grâce à (13.2) on en déduit l'expression de la vitesse v, puis de l'énergie E = mv°/2 
de la particule : 
h Q h 
v=n— ; E=E,=n —— (13.10) 
2mL : 
À la différence du système classique équivalent, l'énergie du système quantique est 
donc quantifiée. On appelle « niveaux d’énergie » ces différentes valeurs. À chacun 
d’entre eux est associée une fonction d’onde de forme bien déterminée, donc un vec- 
teur d’état |7,) bien caractérisé (figure 13.12). On appelle « état fondamental » l’état 
quantique de plus basse énergie, et « états excités » les autres. L'état fondamental est 
celui dans lequel se trouve généralement le système en l’absence d’excitation exté- 


rieure. 
Fonctions Densités de 
d'onde probabilité 





E,=9h?/8mL? - 


E,=4h//8mLl? -- 


E,=h/8mLl? -- 


Figure 13.12 - Premiers niveaux d'énergie, fonctions d’onde associées, et densités de 
probabilité pour un puits de potentiel carré infini de largeur L. 
(source libre : http:/commons.wikimedia.org/wiki/File:Particle_in_a_box_wavefunctions.png) 
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13.2. Quantification de l’énergie pour une particule confinée 


Pour un électron et pour de petites valeurs de n, les énergies E, sont extrême- 
ment faibles dès lors que L est supérieur au um. Elles sont par contre de l’ordre de 
l’électronvolt si L est de l’ordre du nanomètre. Dans les « boîtes quantiques » de 
taille de l’ordre du nanomètre, l’électron a donc une énergie comparable à celle d’un 
atome, d’où le nom d’« atome artificiel » donné à ces boîtes quantiques. Leurs niveaux 
d'énergie sont ajustables en variant la dimension de la boîte lors de la fabrication. 

Remarquons pour finir que la plus basse énergie possible de la particule est £1 = 
h°/8mL”, quantité strictement positive, donc supérieure à l’état de plus basse énergie 
E = 0 de la particule classique. Nous aurons plus loin une explication qualitative de 
cette propriété. 

La quantification de l’énergie est une des propriétés fondamentales des objets 
quantiques : on retrouve une dépendance de l’énergie en fonction d’un ou plusieurs 
nombres entiers dans tous les systèmes quantiques dans lesquelles la particule se 
trouve confinée, d’une manière ou d’une autre, dans une région finie de l’espace, 
comme les atomes ou les molécules. En particulier, l’atome d’hydrogène a des ni- 
veaux d’énergie donnés par la relation E, = —13,6/n° eV où n est entier, expression 
que l’on peut retrouver en imposant à l’onde de matière (électronique) de compor- 
ter un nombre entier de longueurs d’onde de de Broglie sur une orbite circulaire de 
l’électron autour du noyau. 


13.2.2 Application : système à deux états, quhit 


Si l’on se restreint à des états quantiques peu excités de la boîte qui se décomposent 
uniquement sur l’état fondamental n = 1 et le premier niveau excité n = 2, l’état le 
plus général dans ce contexte s’écrit : 


(7) = @11P1) + a2l#2) (13.11) 


C’est un système à deux états proche de celui d’un photon polarisé, mais localisé dans 
une boîte de très petite taille. Les deux états sont des «bits » sur lesquels on peut faire 
du calcul, comme sur les bits 0 et 1 d’un ordinateur. Mais ici le système est quantique, 
et 1l s’agit de « qubit », sur lequel on peut faire des opérations quantiques différentes 
de celles d’un ordinateur classique. C’est le domaine de l’information quantique, en 
plein développement à l’heure actuelle car on a montré théoriquement que le calcul 
quantique pouvait réaliser certaines opérations beaucoup plus vite qu’un ordinateur 
classique (le calcul d’une opération logique sur une superposition de N états permet- 
tant le calcul parallèle de 2 données en même temps). Il s’agit maintenant de passer 
de la théorie à la pratique ! 

À l'heure actuelle, en 2012, la réalisation pratique de tels qubits se fait au moyen 
d’ions piégés, de boîtes quantiques, de circuits supraconducteurs.. En mars 2011, 


205 


2015 Dunod. 


opyright € 


C 


Chapitre 13 + Ondes de matière : une introduction à la fonction d’onde 





Figure 13.13 - « Record » de fabrication, en 2012, de 14 qubits, réalisés avec des ions 
piégés, dans le laboratoire de Rainer Blatt en Autriche. 
(source : « 14-Qubit Entanglement : Creation and Coherence », T. Monz, P. Schindler, J.T. 
Barreiro, M. Chwalla, D. Nigg, W. A. Coish, M. Harlander, W. Hänsel, M. Hennrich, R. Blatt, 
Phys. Rev. Lett. 106, 130506, 2011) 


le record du nombre de qubits dans une architecture viable pour former un (futur) 
ordinateur quantique était de 14 qubits (figure 13.13). 


13.2.3 Interaction avec la lumière 


Lorsqu'un électron est piégé dans une boîte quantique, les règles d’absorption et 
d'émission de photons (chapitre 10) impliquent que les seules longueurs d'onde élec- 
tromagnétiques émises ou absorbées par l’électron sont celles qui correspondent au 
passage d’un niveau d'énergie à un autre (règle de Bohr) : 


8mcL?/h 


\n°2 . n?| 


hc 


———— 13.12 
E;; LE Ë;, | , 


Es — E;l = RVyn > Ay-n = 








Par exemple, pour la transition entre le premier état excité n = 2 et l’état fondamental 
n' = 1, on obtient : A = 10 6.L2 où L est exprimée en nanomètres. Les nanotech- 
nologies permettent de fabriquer des « boîtes quantiques » ayant des tailles de l’ordre 
de l’intervalle entre atomes dans un cristal, donc de l’ordre du nanomètre. En réglant 
la taille de ces boîtes, on peut déterminer à volonté la couleur qu’elles absorberont 
ou émettront. 


13.2.4 Les boîtes quantiques en pratique... 


Ce contrôle très précis de la couleur (et des autres propriétés électroniques) des boîtes 
quantiques intéresse beaucoup l'ingénierie laser. En effet, l’utilisation de boîtes quan- 
tiques comme milieu actif pour produire des lasers aux propriétés bien contrôlées 
(longueur d’onde, intensité, stabilité) est aujourd’hui un domaine en plein essor. Les 
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13.2. Quantification de l’énergie pour une particule confinée 


InAs Quantum-dot Active Layer 





Optical Signal 


Figure 13.14 - Exemple de laser à boîtes quantiques. Au sein d’un sandwich de 
semi-conducteurs (arséniure de gallium et d'aluminium), les nanocristaux, 
semi-conducteurs eux aussi (InAs, arséniure d’indium), forment une couche de boîtes 
quantiques (Quantum-dot Active Layer) qui émet une lumière laser (Optical Signal). À 
droite, deux images des nanocristaux en microscopie électronique, en coupe (Cross 
Section) et vus de dessus (Plane View). « Quantum Dot Laser » de gallium 
indium phosphide. 

(source : http://www.futura-sciences.com/fr/news/t/technologie-1/d/un-laser-quantique-miniature-pour-les- 
picoprojecteurs 20616) 


applications en médecine (scalpel laser, tomographie optique) et dans les nouvelles 
technologies de l’information et de la communication sont sans cesse plus nom- 
breuses. Elles sont en particulier au cœur des lasers qui produisent les impulsions 
lumineuses qui transportent l’information dans le réseau Internet. 

D'un point de vue pratique, une boîte quantique n’est rien d’autre qu'un petit cris- 
tal de matériau semi-conducteur au sein duquel un ou plusieurs électrons sont confi- 
nés (à une, deux ou trois dimensions d’espace). Les bords du puits de potentiel res- 
senti par ces électrons correspondent donc (à peu près) aux bords physiques de ce 
cristal. Par conséquent, on peut moduler à volonté les propriétés de ces boîtes quan- 
tiques (entre autres la couleur qu’elles émettent ou absorbent) simplement en réglant 
la taille du cristal. 

Comment alors créer ces petits cristaux ? Et, surtout, comment les créer de telle 
sorte qu’ils aient tous la même taille ? 

Il existe en fait plusieurs méthodes pour créer des boîtes quantiques aujourd’hui. 
La plus utilisée est celle basée sur la croissance (chimique) de nanocristaux en solu- 
tion, dont on contrôle la température et la concentration (méthode dite « colloïde »). 
Formées d’alliages binaires (séléniure ou sulfure de cadmium, arséniure ou phos- 
phure d’indium) ou ternaires (sélénio-sulfure de cadmium), les boîtes quantiques 
qui en résultent ont une taille (bien contrôlée) de l’ordre de quelques nanomètres, 
et peuvent être produites par paquets de plusieurs millions en même temps. 

D’autres méthodes de production, comme la lithographie ou la croissance par épi- 
taxie, sont aujourd’hui également exploitées. 
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Figure 13.15 - Image de fluorescence de boîtes quantiques injectées en très grand 
nombre dans une cellule (d’une taille de quelques dizaines de micromètres). Quinze 
minutes après le début de l’expérience, les boîtes quantiques sont dans la membrane 
cellulaire (image de gauche). Au bout de quatre heures, elles ont pénétré la cellule et se 
sont distribuées dans le fluide cellulaire (image de droite, où la zone centrale plus 
sombre est le noyau cellulaire). L'utilisation de boîtes quantiques pour introduire un 
complexe actif dans une cellule tout en suivant sa progression est de plus en plus 
étudiée. 

(source : www.washington.edu/news/2008/06/26/gene-silencer-quantum-dots-reduce-protein-production/) 


Les propriétés particulières des boîtes quantiques en font d’excellentes candidates 
pour de multiples applications : en micro-électronique et en information quantique, 
par exemple, mais aussi, et surtout, dans le domaine de la biologie cellulaire où elles 
permettent d’avoir accès, in vivo et avec une résolution inégalée, aux processus inter- 
cellulaires ou au traçage en temps réel de cellules (figure 13.15). 

Bien évidemment, l’introduction de nanocristaux semi-conducteurs dans un corps 
vivant n’est pas sans risque et de nombreuses équipes tentent actuellement de déter- 
miner leur toxicité, à court et plus long terme. 


SEncarr 13.1 Lien entre fonction d'onde et vecteur d'état 


On a dit au chapitre 12 qu’à tout système physique était associé un vecteur d’état 
k(t)). Le lien entre la fonction d'onde d’un système matériel 4 (r,t) et son vecteur 
d'état Wÿ(t)) est l’objet de cet encart. 

Pour le photon polarisé, on avait introduit le vecteur d'état |) = a|H)+B|V), com- 
binaison linéaire des états |H) et V}, qui sont les deux seuls états quantiques du 
photon qui ont un comportement certain lors de la traversée d’un polariseur «X», 
c'est-à-dire lors de la mesure de la polarisation du photon selon Ox : |H) passe 
à coup sûr, et |V) est absorbé à coup sûr. |) est donc défini par la donnée des 
nombres complexes « et 8 (avec la condition de normalisation |a{? +[8]? = 1), coor- 
données du vecteur |?) sur la base {|H),V)}. Si le photon incident est décrit par un 
tel état, son passage à travers le polariseur X est aléatoire, la|? étant la probabilité 
de transmission et [2/2 la probabilité d'absorption (loi de Malus). 
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13.2. Quantification de l’énergie pour une particule confinée 


On se place maintenant dans une configuration analogue à celle d'un photon 
décrit par une onde plane se propageant dans la direction Oz, en l'occurrence 
une particule de masse m se déplaçant le long de l’axe Oz dont on veut connaître 
la position selon la direction Ox. Pour cela, on utilise un détecteur de particules 
D, qui fournit un « clic » si la particule passe entre les points de coordonnées x, 
et x,:1 (figure 13.16). On appelle |x,) le vecteur qui décrit l’état de la particule 
qui arrive à coup sûr sur ce détecteur (il a pu être créé par exemple par un écran 
absorbant qui comporte un trou entre les abscisses x, et x,.,). On peut ensuite 
aligner le long de l’axe Ox N détecteurs analogues D, (n = 1,...,N) qui « couvrent » 
tout l’axe, et permettent de savoir où se trouve la particule (figure 13.16). Par 
analogie avec le cas du photon polarisé rappelé dans le paragraphe précédent, 
un état quantique quelconque de la particule est alors décrit par le vecteur d'état : 


N 
17) = D Unix) (13.13) 
n=1 
X 

Xs|® D 
x, 7 
o> .|B— 0: 
6 le D. 
xs D 
Xx4 | à 


Figure 13.16 - Ensemble de détecteurs permettant de connaître la position le long 
de l’axe Ox d’une particule se déplaçant avec une vitesse parallèle à Oz 


où les #, sont les coordonnées du vecteur |Ÿ) sur la base |x,). |) est donc défini 
par la donnée de la liste des nombres complexes #, (avec la condition de norma- 
lisation >, |#,l? = 1). Si la particule incidente est dans l'état |Ÿ), elle sera détectée 
aléatoirement par l’un de ces détecteurs, |,|? étant la probabilité de détection 
par le détecteur D,. Précisons que nous nous sommes placés ici à un instant fixé 
t, et qu’il faut donc écrire en toute rigeur : 


N 
(PC) = Ÿ WA (OIxn) (13.14) 
n=] 


Si le détecteur D, ne détruit pas la particule (c’est par exemple un trou dans 
un écran suivi d’un détecteur de grande dimension), le postulat P2 implique que 
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dans le cas où la particule a franchi le trou, son état conditionnel après traversée 
de l’écran est l’état |x,), indépendant de l’état incident. 


Pour connaître le plus précisément possible la position de la particule, on diminue 
la taille x,:, — x, des détecteurs. Lorsque celle-ci tend vers zéro (et le nombre de 
détecteurs vers l'infini), on passe à la limite continue en remplaçant par une 
intégrale la somme dans (13.14), et l’on écrit : 


lP(t)) = [ dx y{(x, tx) (13.15) 


IX) étant l’état de la particule qui est détectée à coup sûr par un détecteur de 
taille infinitésimale gx situé en x. |) est donc défini par la donnée de la fonction 
complexe y{x,t), appelée fonction d'onde. Si la particule incidente est dans l’état 
|Y) elle sera détectée aléatoirement par l’un de ces détecteurs, |y(x,t)l? dx étant 
la probabilité de détection de la particule à l'instant t et entre les positions x et 
X + dx. 


13.3 INÉGALITÉS DE HEISENBERG 


Nous avons vu que la fonction d’onde ne contient qu’une information de type pro- 
babiliste sur les résultats de mesure de position que l’on peut faire sur le système. 
Sauf cas très particulier, la valeur de la position mesurée ne sera donc pas certaine, 
et si l’on fait des mesures répétées sur le système quantique toujours préparé dans le 
même état quantique, on enregistrera des résultats fluctuants. Nous allons maintenant 
préciser les contraintes qui existent sur ces fluctuations. 


13.3.1  Écart-type 


Prenons comme exemple la mesure de la position le long de l’axe Ox. La valeur 
trouvée x est une grandeur aléatoire dont la loi de probabilité est P(x) = (x, D. La 
valeur moyenne (ou espérance mathématique) < x > et l’écart-type Ax des valeurs 
mesurées sont donnés par les formules habituelles du calcul des probabilités : 


<x>= [ xP(x)dx  : <x >= [ x P(x)dx 
Ax= V<x>-<x>?2 


L’écart-type, dans le cas d’une distribution de probabilité formée d’une seule 
« bosse », donne une idée de la dispersion des résultats de mesure autour de la va- 
leur moyenne, donc de l’incertitude sur la mesure. C’est alors, en ordre de grandeur, 
la « largeur » de la bosse. 
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13.3. Inégalités de Heisenberg 


13.3.2 Inégalité de Heisenberg position-impulsion 


Il est aussi possible, comme nous le verrons plus en détail dans le chapitre suivant, 
de faire une mesure de la vitesse de la particule, et en particulier de sa composante v, 
le long de l’axe Ox. Cette mesure donne aussi des résultats généralement incertains, 
avec une loi de probabilité connue qui s’exprime elle aussi en fonction de la fonction 
d’onde ÿ(x,r) du système. Cette dépendance commune de deux types de mesure par 
rapport à une même fonction induit des contraintes sur les caractéristiques de ces 
mesures. Une démonstration mathématique permet d’établir le résultat suivant : 


Dans n'importe quel état quantique, les écarts-types relatifs aux me- 
sures de position et de vitesse dans le même état obéissent à l'inégalité : 


ñ 
mAv,Ax > 5 (13.16) 


Cet énoncé est parfois appelé, principe d’incertitude, doublement à tort car d’une 
part il laisse penser que cette inégalité résulte d’une imprécision expérimentale alors 
qu’en fait elle est de nature fondamentale, et d’autre part il ne s’agit pas d’un nouveau 
principe de la théorie, mais une propriété mathématique se déduisant des principes 
déjà énoncés. II serait préférable de parler d’indéterminations quantiques Ax et Av, 
vérifiant, avec certitude, la relation (13.16). 

L’inégalité de Heisenberg (13.16) implique qu’un état dans lequel la position de 
la particule est parfaitement définie (Ax = 0) présente une dispersion infinie sur la 
mesure de sa vitesse (Av, = co), et qu’un état dans lequel la vitesse de la particule 
est parfaitement définie (Av, = 0) présente une dispersion infinie sur la mesure de 
sa position (Ax = co). Elle exclut tout état pour lequel on aurait Ax = Av, = 0, 
ce qui entraîne qu’on ne peut pas connaître avec certitude à la fois la position et la 
vitesse d’une particule. Elle condamne donc toute notion de trajectoire précise de la 
particule dans un état quantique. 

Mentionnons qu’en outre pour des états quantiques de basse énergie, le produit 
mAvAx est souvent de l’ordre de ñ. 

La relation de Heisenberg ne concerne que les indéterminations suivant la même 
direction de l’espace et au même instant. Ainsi, on a aussi, suivant les axes y et z : 


MAyAU, > (13.17) 


mAZAU, > (13.18) 


DIS DIS 


mais il n’existe pas de condition similaire entre Ax et Av, par exemple, ou entre Ax et 
Ay, OU Av, et Av... ce qui autorise, par exemple, de réaliser des mesures infiniment 
précises de la position d’une particule suivant l’axe x et de sa vitesse suivant l’axe y. 
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13.3.3 Interdiction du repos total 


Imaginons une particule au repos, donc arrêtée en un point donné de l’espace et de 
vitesse nulle : on connait donc parfaitement à la fois sa vitesse et sa position, ce qui 
est interdit par l’inégalité de Heisenberg. Un tel état n’existe pas dans le cadre d’une 
description quantique. C’est la raison pour laquelle l’état quantique de plus basse 
énergie de la boîte quantique n’est pas d’énergie nulle. 

On peut faire un raisonnement plus précis : dans une boîte quantique l’incerti- 
tude Ax sur la position de la particule est inférieure ou égale à la taille a de la boîte. 
L’inégalité de Heisenberg implique donc que l’incertitude sur la vitesse Av, est su- 
périeure à ñ/(2ma). Dans un état stationnaire du système, par raison de symétrie, la 
vitesse moyenne < v, > est nulle et donc < v? >= Av, < v, >2?= Av,. Donc 
dans tout état stationnaire de la boîte, l’énergie cinétique moyenne m < v? > /2 est 
supérieure ou égale à #?/(8ma°), ce qui donne le bon ordre de grandeur de l’énergie 
minimale E:. 


13.3.4 Lien avec la diffraction 


L’inégalité de Heisenberg est en fait une conséquence du caractère ondulatoire de la 
matière quantique. On peut s’en persuader par l’exemple suivant où on la relie à un 
phénomène ondulatoire bien connu, celui de la diffraction introduite à la section 13.1 : 
une onde de longueur d’onde 1 se propageant le long de l’axe OZ et incidente sur un 
trou de dimension d le long de Ox percé dans un écran absorbant situé dans le plan 
xOy (figure 13.1) donne naissance de l’autre côté de l’écran à une onde divergente 
s’écartant de Oz d’un angle maximal 6,, donné par : 


Sin 0» = ; (13.19) 


Ce phénomène de diffraction est commun à tous les phénomènes ondulatoires (lu- 
mière, son, vagues sur l’eau.) et existe aussi pour les ondes de matière. Lorsqu'une 
particule de masse m et de vitesse v le long de OZ est incidente sur l’écran décrit 
ci-dessus, son onde de matière diffracte à la sortie du trou selon la même loi (13.19) 
avec À = A3. 

Considérons l’état quantique du système juste après le trou. Dans cet état, la par- 
ticule possède une fonction d’onde qui est non nulle uniquement au niveau du trou, 
donc où la position le long de l’axe Ox de la particule est définie avec un écart-type Ax 
égal à d. À cause de la diffraction, la particule après l’écran dévie d’un angle aléatoire 
@ par rapport à Oz, positif ou négatif, inférieur en module à l’angle de diffraction a. 
Elle acquiert donc une composante de vitesse selon la direction Ox qui est aléatoire 
et vaut v sin @. L'écart type sur v,, Av,, est donc de l’ordre de v sin &,,. On a ainsi : 


mAv,Ax = mvsin a, d = mvAyg = h (13.20) 


On retrouve ici un produit mAv,Ax de l’ordre de À. 
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13.3. Inégalités de Heisenberg 


13.3.5 Généralisation 


Position et vitesse forment un couple appelé « complémentaire » par Bobhr, parce 
qu’on ne peut les connaître parfaitement dans un même état quantique. Il y en a 
d’autres en mécanique quantique. Citons par exemple l’angle de rotation @ autour 
d’un axe, et le moment cinétique J calculé autour de cet axe, dont les écarts-types 
obéissent à la même inégalité 

AgAJ>h (13:20) 


L'énergie E d’un système et un temps caractéristique 7 de l’évolution du système 
obéissent également à une relation proche : 


AET = (13.22) 


Par exemple, un état atomique excité n’est en général pas stable. Il a une durée 
de vie 7. Au bout d’un temps aléatoire de l’ordre de 7 l’atome transite vers un état 
d'énergie inférieure en émettant un photon, d’une manière analogue à un noyau in- 
stable qui se désintègre (chapitre 8). On montre que l’énergie de l’état excité instable 
n’est pas parfaitement définie, et que l’incertitude AE sur sa valeur vaut : 


AE = 4 (13.23) 
. 

Cette relation temps-énergie n’est pas de même nature que les autres inégalités de 
Heisenberg, la durée 7 n’étant pas liée à un quelconque écart-type d’une distribu- 
ton «en temps » d’une grandeur « temps du système » par exemple. Le temps f en 
mécanique quantique n’est pas une variable mais un paramètre. 

Il existe donc en mécanique quantique des couples de grandeurs (x et p,, & et 
J, E et +...) qui ne sont pas mesurables sur un système donné avec une précision 
infinie. C’est une illustration d’une propriété quantique spécifique, appelée principe 
de complémentarité par Bohr. Ces grandeurs reflètent des aspects d’un même système 
qui ne peuvent pas être connus avec certitude dans le même état quantique. Ce n’est 
alors qu’en considérant l’ensemble de ces éléments complémentaires que l’on obtient 
l’image du système la plus complète possible autorisée par les lois quantiques. 
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Le chapitre précédent nous a permis d’introduire la notion de fonction d’onde et plu- 
sieurs propriétés importantes de celle-ci à un instant f donné : sa longueur d’onde 
caractéristique Ag, son interprétation probabiliste, son lien avec la notion de vecteur 
d’état, les liens entre ses fluctuations caractéristiques Ax, Av,, AE... Dans ce chapitre, 
nous allons introduire l’équation d’évolution à laquelle elle obéit. L'évolution tem- 
porelle n’a été vue, en effet, que dans le cas des vecteurs d’état |(r)) et non pour les 
fonctions d’onde y (x, f). 

Mais avant d’aborder l’équation d’évolution, il est utile de préciser les propriétés 
vérifiées par une fonction d’onde quelconque. 


14.1 PROPRIÉTÉS DE LA FONCTION D’ONDE 


Une fonction d’onde #ÿ (x,f) (où l’on a fait apparaître la dépendance temporelle pour 
plus de généralité) doit obéir à certaines conditions et vérifier certaines propriétés. En 
voici la liste : 


° deux fonctions d’onde différant par un nombre complexe eŸ de module un (que 
l’on appelle communément un facteur de phase) 


p(x) = # (x) el? avec OER (14.1) 


conduisent aux mêmes probabilités de présence. Cette propriété est en fait très gé- 
nérale et concerne tout type de mesure (pas nécessairement de position lorsque le 
coefficient 0 ne dépend pas de x). Un tel facteur de phase (global) n’ayant aucun 
effet sur les résultats de mesure, la description d’un système physique peut s’ef- 
fectuer, de façon totalement équivalente, à l’aide de # (x) ou w (x). On dit qu’une 
fonction d’onde est définie à un facteur de phase près. 


e y (x,t) doit être continue partout. 
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e sa dérivée spatiale doit être continue partout, sauf en un nombre fini de points 
isolés (par exemple, là où l’énergie potentielle est infinie, comme dans le cas des 
bords du puits carré infini vu au chapitre précédent). 


e la probabilité de détecter la particule entre les points x et x2 vaut Le . dx {y (x,t) 2 
(interprétation de Born vue au chapitre précédent). 


e ÿY(x,t) doit être de carré sommable (condition de normalisation) : 


[ kr (x, D dx = 1 (14.2) 


ce qui traduit simplement le fait que l’on est sûr (c’est-à-dire avec une probabilité 
égale à un) de détecter l’objet physique en question quelque part le long de l’axe x. 


14.2 COMMENTAIRES 


1. 
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Mathématiquement, les propriétés ci-dessus ne traduisent rien d’autre que le 
fait que les fonctions d’onde appartiennent à un espace vectoriel : l’espace 
vectoriel de Hilbert des fonctions complexes, continues, de carré sommable 
(que l’on note L?2(R) à une dimension d’espace et L?(R>) à trois dimensions 
d’espace). Cet espace vectoriel est appelé espace des états de la particule ma- 
térielle. 


Comme pour tout type d’onde, les fonctions d’onde obéissent à un principe 
de superposition : Si ÿ1 (x;f) et ÿr2 (x,f) sont deux fonctions d’onde possibles 
pour un système, alors toute combinaison linéaire (à coefficients complexes, 
normalisée à un) de ces fonctions d’onde est aussi une fonction d’onde possible 
pour ce système. 


Le produit scalaire (7175) de deux vecteurs d’état |[Ÿ,) et |) s’exprime en 
fonction des deux fonctions d’onde associées par 


(P11P2) = | dx p(x)2(X) (14.3) 


où ÿ (x) est le complexe conjugué du nombre complexe W1(x). 


Si on utilise un détecteur de position « non destructif », qui n’absorbe pas la 
particule lorsqu'il la détecte (comme la chambre à fils des physiciens des par- 
ticules), et que le détecteur D, « clique », la particule après la mesure est dans 
l’état conditionnel |x,) introduit dans l’encart du chapitre précédent (c’est-à- 
dire |x) à la limite continue) quel que soit l’état de la particule incidente. On 
parle de réduction ou de projection dans l’état |x,). 
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14.3. Équation de Schrôdinger pour la fonction d’onde 


14.3 ÉQUATION DE SCHRÔDINGER 
POUR LA FONCTION D’ONDE 


Comme pour toute onde, le lien entre la variable x et le paramètre f découle direc- 
tement de la relation entre la pulsation w et le vecteur d’onde k = ||k||, c’est-à-dire 
de la relation entre l’énergie E et la quantité de mouvement p. Cette relation, appe- 
lée relation de dispersion, est très importante pour savoir comment évolue une onde 
réelle, c’est-à-dire une onde composée de plusieurs ondes élémentaires (planes, par 
exemple). 

Pour une particule libre de matière, on a simplement E = p°/2m ce qui conduit à la 
relation de dispersion w = fk?/2m. En revanche, pour un photon ou toute particule de 
masse nulle, on a E = ||p||c, et la relation de dispersion s’écrit simplement w = ||k||c. 


14.3.1 Onde plane de matière 


On considère une particule de masse m, de vitesse v, et d'énergie E bien déterminées. 
On lui associe une onde dont la pulsation et le vecteur d’onde sont donnés par (13.1). 
On postule que la fonction d’onde décrivant un tel état quantique s’écrit : 


Ur, 0 = do expGk : r — iwf) = Vo exp (= r- En) (14.4) 


où ÿ0 est fixé, à un facteur de phase près, par la condition de normalisation à 1. 
Cette forme est « plausible », car elle ressemble à l’onde plane lumineuse du cha- 
pitre 2. Remarquons toutefois que le champ électromagnétique de l’onde lumineuse 
est une quantité réelle, et que l’on n’utilise le champ complexe que par commodité de 
calcul, alors que l’onde de matière est nécessairement décrite par une exponentielle 
complexe. On peut justifier cette différence par le fait que l’énergie E d’une parti- 
cule n’est définie qu’à une constante additive près. Un décalage global en énergie 
E — E + Eo pour la particule se traduit sur la fonction d’onde par la multiplication 
par le facteur de phase e/#0//", qui ne change pas les prévisions physiques sur la par- 
ticule. Il n’en est pas de même sur la forme réelle, en cosinus, de l’onde lumineuse, 
qui, étant proportionnelle à la force électrique, quantité mesurable, n’a pas la même 
invariance par changement de phase. 

Remarquons que pour l’onde plane de matière (14.4) Iy(r,n)1? = Igol? ne dépend 
ni de r ni de f. La probabilité de présence d’une particule de vitesse v et d’énergie E 
bien déterminées est la même en tout point : on dit que la particule est délocalisée. 

Il est à noter qu’une onde plane n’est pas véritablement une fonction d’onde puis- 
qu’elle n’est pas de carré sommable (l'intégrale de son module au carré vaut l’infini). 
En fait seule une somme (continue) d’ondes planes peut vérifier cette condition. Il 
n’en reste pas moins que les ondes planes sont très utiles d’un point de vue pratique 
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(exactement comme en électromagnétisme). D’une part, l’équation de Schrôüdinger 
étant linéaire, si l’on sait comment évolue une onde plane, on sait comment évo- 
lue toute somme (continue ou discrète) d’ondes planes, c’est-à-dire finalement route 
fonction d’onde. D’autre part, une onde plane peut souvent être utilisée comme pre- 
mière approximation d’une fonction d’onde décrivant une particule de vitesse p/m 
délocalisée dans une zone étendue de l’espace. 


14.3.2 Équation d'évolution pour la fonction d’onde 


Remarquons que pour toute onde plane de matière (14.4) : 


2 2,2 


ô iE Ô LE 
UE = EE) 5 UD = -— 





ÿ(r,1) (145) 


où v, est la composante de la vitesse selon x. 


Considérons alors le cas où la particule est soumise à une force dérivant d’un 
potentiel (comme le potentiel gravitationnel par exemple, ou le potentiel électrique). 
Son énergie E est la somme de l’énergie cinétique et de l’énergie potentielle | que 
nous noterons V(r), donc E s’écrit : 


1 
E = mi + 0, +0) + V() (14.6) 


En multipliant les deux membres de cette relation par ÿ(r,r) et en utilisant (14.5), 
on obtient une équation satisfaite par toutes les ondes planes de matière, quelles que 
soient leur énergie et leur vitesse : 


n°? ED La EC . © 
MEN ot ae 02 


Ju + V0) (14.7) 

C’est une équation linéaire en ÿ, qui est donc aussi satisfaite par toutes les su- 
perpositions linéaires d’ondes planes, et donc par toutes les fonctions d’onde de la 
particule. On l’appelle équation de Schrüdinger. 


Nous allons maintenant résoudre cette équation dans trois configurations particu- 
lières de potentiel : la particule libre, le puits carré infini, et la marche de potentiel. 


1. Par exemple, le potentiel V s’écrit V = +mgz dans le cas d’une particule de masse m dans un champ 
gravitationnel uniforme ÿ, de sens opposé au vecteur unitaire définissant l’axe z. 
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14.4. Exemple 1 : la particule libre 


14.4 EXEMPLE Î : LA PARTICULE LIBRE 
14.4.1 Onde plane unique 


Considérons une particule libre, de masse m, évoluant selon la direction x avec la 
vitesse v > 0. Conformément à la section précédente, elle est décrite par une onde 
plane : 


U(x, 0) = proeñ ("En (14.8) 


où l’énergie E est égale à son énergie cinétique +mv? puisque V = 0. 
Comme souligné précédemment, la particule ainsi décrite est délocalisée dans 
tout l’espace puisque le module au carré de ÿ(x,f) ne dépend ni de x ni de f : 


(xD = pol. 


14.4.2 Superposition d'ondes planes 


Revenons à l’exemple de l’interférence d’électrons décrite à la section 13.1.4 (fi- 
gure 13.8). Le fil électrique chargé dévie vers la droite un électron se propageant le 
long de OZ et passant à gauche du fil, et vers la gauche un électron passant à droite de 
celui-ci. On peut considérer, en première approximation, qu’en dessous du fil, l’élec- 
tron est décrit par la somme de deux ondes planes, l’une correspondant à la particule 
de vitesse v dont la direction fait un angle —6 avec l’axe Oz : 


Y1(r,f) = Yo exp (ae cos Ü — x sin 6) — iEt/h) (14.9) 


et l’autre correspondant à la particule de vitesse v dont la direction fait un angle +0 
avec l’axe Oz : 


V0) = Vo exp (E cos 8 + xsin 6) — iEt/h)) (14.10) 
Il y a donc analogie parfaite avec le calcul d’interférences lumineuses fait dans le cas 


du biprisme au chapitre 10. 
Dans la région de recouvrement de ces ondes, l’électron a pour fonction d’onde : 


1 imvz cos 0 — iEt mux sin 0 
ÿ(r,t) = LE: + ÿ2) = V2yoexp [= (_ 


La probabilité P(r,r) = |y|? de présence de l’électron au point r vaut donc : 


| (14.11) 


(14.12) 


mux Sin 0 
hñ 


P(r.f) = 2lWol° cos” 
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Elle dépend maintenant de x. Un électron isolé sera donc détecté à une position aléa- 
toire, à l’exception des points où P(r,f) = 0, c’est-à-dire où il y a interférence to- 
talement destructive. Si on envoie un par un de nombreux électrons, le nombre de 
points lumineux enregistrés sur le détecteur à l’abscisse x finira par être proportion- 
nel à P(r,f) et donnera donc naissance à des franges d’interférences dans la densité 
d'électrons. 

D'une façon générale, si l’on considère deux fonctions d’onde possibles, #1 (x,f) 
et 2 (x,f), pour un système physique, c’est le fait que l’on somme les amplitudes de 
probabilités #1 (x,f)+y (x,f) et non les densités de probabilités lg (x, + (x, P, 
qui permet de rendre compte des phénomènes d’interférences d’ondes de matière : 





Wa + Vol = il + pal + (iv + vus) (14.13) 
ne, ee” 
inter férences 


où y; représente le complexe conjugué du nombre W1. 


14.5 EXEMPLE 2 : LE PUITS CARRÉ INFINI 


On considère, comme dans la section 13.2, une particule se déplaçant le long de l’axe 
Ox et soumise à un potentiel V(x) qui est infini pour x < 0, nul pour 0 < x < L 
et à nouveau infini pour x > L. Il s’agit d’une particule libre entre deux « murs » 
situés en x = 0 et x = Z, qu’elle ne peut en aucune manière franchir, quelle que soit 
son énergie cinétique (figure 13.11). Nous allons maintenant approfondir l’approche 
de la section 13.2 en cherchant l’ensemble des solutions possibles de l’équation de 
Schrüdinger pour la fonction d’onde Y(x,f). 

La particule a une probabilité nulle de se trouver « de l’autre côté des murs », 
donc wY(x,f) = 0 pour x < 0 et x > L pour tout f. On en déduit par continuité que 
Y(0,r) = Y{L,r) = 0. On cherche donc une fonction complexe ÿ(x,f) de norme 1 
( Î (x, nPdx = 1) satisfaisant à l’équation de Schrüdinger : 


UT RS (14.14) 
RE HO u 2m 6 ‘ 


pour x appartenant à l’intervalle [0,ZL], et nulle en 0 et L. 


14.5.1 Recherche de solutions particulières d'énergie 
donnée 


Comme E = ñw, nous allons chercher des solutions « monochromatiques », de pul- 
sation w donnée, donc de la forme : 


px) = pre EM (14.15) 
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14.5. Exemple 2 : le puits carré infini 


On déduit de (14.14) que la fonction $ est solution de l’équation différentielle : 


d 2mE 
12% Te 0) (14.16) 
et doit aussi être nulle en 0 et L. 

Nous cherchons une solution d’énergie positive E > 0 à (14.16). Celle-ci s’écrit 
sous la forme d’une combinaison linéaire d’exponentielles complexes : a/e**+B'e" {x 
avec k = V2mE/", et peut donc être mise, de façon équivalente, sous la forme : 
a sin kx+B cos kx, où a et B sont deux constantes complexes. La condition aux limites 
(0) = 0 impose alors que B = 0, tandis que la condition aux limites (L) = sin &L = 
0 impose que k ne peut pas prendre n'importe quelle valeur. Plus précisément k est 
un des k, obéissant à la relation : 


ky = ZT (14.17) 
où n est un entier naturel non nul. La condition de normalisation impose alors que 
a = V2/L à un facteur de phase près, sans signification physique. 

Toute solution d’énergie donnée E, de l’équation de Schrüdinger s’écrit donc (pour 
le puits carré infini) : 





2. 
LG = Een sin (=) (14.18) 
l’énergie E, valant : 
h? 2 
E,=n UE (14.19) 


Comme nous l’avons déjà noté au chapitre précédent, dans un tel système, l’énergie 
ne peut prendre que certaines valeurs : elle est quantifiée. 
La densité de probabilité P,(x) de présence de la particule en x dans un état n vaut 


ln(xt )? : 

PAC = + sin? (=) (14.20) 
Elle est indépendante du temps : contrairement au cas classique (où la particule fait 
constamment des allers-retours entre les murs), la particule quantique « ne bouge 
pas », d’où le nom d’état stationnaire donné aux états quantiques d’énergie totale non- 
nulle déterminée. P,(x) définit une sorte de « nuage fixe », caractérisant de manière 
statistique la position de la particule. 

La figure 14.1 montre les variations spatiales des premières densités de probabilités 
de présence P;(x), P,(x), P3(x). Ces probabilités ne sont maximales qu’en certains 
points du puits et s’annulent en d’autres points (appelés nœuds de vibration), en to- 
tale contradiction avec la description classique où l’on s’attend à détecter la particule 
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P1(x), P2(x), P3(x) 
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Figure 14.1- Densités de probabilité de présence P, (x), P;(x), P3(x) du puits carré infini 
entre x=0 et x = L. 


en tout endroit du puits avec la même probabilité. Cependant, plus le nombre quan- 
tique 7 augmente, plus la distribution de probabilité P,(x) présente des nœuds de 
vibration de plus en plus proches les uns des autres (figure 14.2 où sont représentées 
P1(x), P20(2) et Poassique = V/L). Pour un nombre 7 suffisamment grand, ces nœuds 
de vibration sont si proches qu'il est impossible de les distinguer expérimentalement. 
Dans ce cas, une mesure de position de résolution dx reviendrait à moyenner la distri- 
bution de probabilité P,(x) sur l'intervalle dx, la densité de probabilité obtenue étant 
uniforme et donc égale à 1/L comme dans le cas classique. Ceci est un exemple de 
ce qu’on appelle parfois le principe de correspondance, et qui indique que l’on s’at- 
tend à retrouver certaines propriétés classiques lorsque l’on fait tendre les nombres 
quantiques vers l'infini. 


14.5.2 Solution générale 


L’équation de Schrüdinger étant linéaire, la solution générale s’obtient en superposant 
les solutions particulières. On peut montrer que les solutions stationnaires trouvées 
dans la section précédente forment une base de l’espace des solutions. La solution la 
plus générale de l’équation de Schrüdinger s'écrit donc : 


D) = D bn = D ane Ep (0) (14.21) 


Elle est définie par la donnée de la liste des coefficients (œ,). 


Intéressons-nous maintenant à la dépendance temporelle d’une fonction d'onde 
particulière, superposition des deux premiers états d'énergie E, et E2 à poids égaux 
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14.6. Généralisation 


P1(x), P20(x), Pclassique 
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Figure 14.2 - Densités de probabilité de présence P(x), P2o(X), Potassique = 1/L du puits 
carré infini entre x = 0 et x = L. 


(c’est-à-dire &1 = à2 = 1/ V2 et a,52 = 0): 
HD = (eg 00 + eg (x) (14.22) 


Prenant les coefficients réels pour simplifier, on en déduit la probabilité de présence 
P de la particule en x : 


(E2 — Ei 


Il 
_ Se 
PQ) = GNT = % 





D1(X) + 450) + 21 (x)b2(x) cos ] (14.23) 
On constate que la probabilité de présence dépend maintenant du temps. La parti- 
cule « bouge » dans un tel état, et son mouvement présente des va-et-vient analogues 
à ceux du mouvement classique (figure 14.3 et l’animation http://en.wikipedia.org/ 
wiki/File:InfiniteSquare Well Animation.gif). 

On note également l'importance cruciale du facteur de phase relatif e 
qui, contrairement au facteur de phase global (section 14.1), ne disparaît pas lorsque 
l’on prend le module au carré de la somme 14.22 et qui est responsable de sa variation 
temporelle. 


—i(E2-E;) ff 


14.6 GÉNÉRALISATION 


En mécanique quantique, contrairement à ce qui se passe en mécanique classique, 
savoir comment évolue un système physique (une particule par exemple) dans un po- 
tentiel donné V (x) revient à déterminer les fonctions d'ondes solution de l'équation 
de Schrüdinger 14.7 (en tenant compte des éventuelles conditions de continuité aux 
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P(x,t) P(x,Ù P(xt 
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Figure 14.3 - Densités de probabilité de présence P(x,t) à six instants différents. La 
maximum de P(x,t) passe, au cours du temps, d’un bord à l’autre de la boîte. 


frontières du domaine de définition du potentiel) ainsi que les énergies possibles du 
système. 

Comme on peut le constater, la résolution de l’équation de Schrüdinger est extré- 
mement simple dans le cas de la boîte quantique, c’est-à-dire du puits carré infini. 
Ce n’est pas surprenant car ce n’est rien d’autre qu’une version « avec frontières » 
(infiniment hautes) du cas de la particule libre pour lequel le potentiel est constant et 
uniforme (et même nul !) V (x) = 0. 

En revanche, lorsque le potentiel dépend explicitement de la position x, l’équation 
de Schrüdinger devient très difficile, voire impossible, à résoudre analytiquement. 
Ce n’est que pour une classe très restreinte de potentiels (puits parabolique, barrière 
rectangulaire, potentiels centraux, etc.) que l’on sait mener à bien les calculs, et il est 
nécessaire, dans la majorité des cas, d’utiliser l’outil numérique. 


14.7 EXEMPLE 3 : MARCHE DE POTENTIEL, ONDE 
DE MATIÈRE ÉVANESCENTE 


Nous allons maintenant nous intéresser à une situation souvent rencontrée dans les 
expériences, celle de la difjusion, ou collision, d’une particule, dans laquelle une 
particule incidente rencontre un obstacle localisé dans l’espace, sur lequel elle peut 
être réfléchie, déviée, ou transmise. Loin de l’obstacle, la particule est donc libre et 
décrite par l’onde plane de matière eilt. 

Nous traiterons 1c1 le cas le plus simple, monodimensionnel dans la direction x, 
dans lequel la particule incidente venant de x = —co, d’énergie E, est libre pour toutes 
les valeurs négatives de x (V(x) = 0 Yx < 0, région I). Elle rencontre en x = 0 une 
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14.7. Exemple 3 : marche de potentiel, onde de matière évanescente 


« marche de potentiel » où l’énergie potentielle passe de 0 à une valeur constante V 
et conserve cette valeur pour toutes les valeurs positives de x(V(x) = VYx > 0, 
région IT) 


14.7.1 Cas d’une particule classique 


Du point de vue classique, la particule n’est soumise à aucune force F = —-dV/dx, 
sauf en x = 0 où elle subit un changement brutal d’énergie cinétique. Si son énergie 
cinétique initiale E est supérieure à V, elle traverse la marche et son énergie cinétique 
(donc sa vitesse) diminue. Si, par contre, son énergie E est inférieure à V, la particule 
ne pénètre pas dans la région des x positifs, mais « rebondit » sur l’obstacle : elle est 
réfléchie en gardant sa vitesse initiale mais change de signe. 

Expérimentalement, un potentiel en forme de marche (figure 14.4) correspond, en 
première approximation, au potentiel ressenti par des particules qui se heurtent à un 
obstacle. C’est le cas, par exemple, des électrons de conduction d’un métal lorsqu'ils 
atteignent la surface de ce métal. Ils restent piégés au sein du métal tant qu’ils n’ont 
pas l’énergie suffisante pour s’en échapper (par effet photoélectrique par exemple). 
La marche de potentiel correspond alors à cette énergie seuil. On peut aussi pro- 
duire par épitaxie des empilements de matériaux semi-conducteurs de composition 
différentes (figure 9.12), qui créent pour l’électron de conduction des marches de 
potentiels ajustables. 


Va) 









Région I : x<0 Région II : x>0 


Figure 14.4 - Marche de potentiel de hauteur V. 


14.7.2 Recherche de solutions d'énergie E donnée 


Comme dans le cas du puits carré infini, la recherche de solutions d’énergie E positive 
donnée conduit aux équations : 





d 2mE 
MODE nil is ss 14.24 
É Fr hr? ( 
d 2m(E — V 
x>0: 6- D (14.25) 
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Dans la région I, la solution est de la forme : 
br (x) = Aeï* + Be KI* (14.26) 


avec k = V2mE/h?. Elle est la superposition de l’onde Aeï*!* décrivant la particule 
incidente et de l’onde Be-“* décrivant la particule réfléchie. 

— Considérons tout d’abord le cas £ > V : la solution dans la région IT est alors 
aussi une somme d’exponentielles complexes : 


Pur (x) = Cefk* + Dex (14.27) 


avec ky = V2m(E - V}/h. C’est donc, en général, la somme de deux ondes se 
propageant vers les x positifs ou négatifs. Comme nous voulons décrire le problème 
de diffusion évoqué plus haut, nous allons chercher une solution où il n’y a qu’une 
onde transmise, se propageant vers les x > 0, donc avec D = 0. 

Par analogie avec une onde lumineuse, nous appellerons coefficient de réflexion R 
la quantité |B/A[° et coefficient de transmission T la quantité [C/A|?. En utilisant les 
conditions de continuité en x = 0 de la fonction d’onde # (x) et de sa dérivée #’ (x), 
il est possible de calculer ces quantités. On trouve : 


(= VE) 
© (1+ VI-VÆ 


On constate donc une différence importante avec le cas classique : il y a une probabi- 
lité non nulle que la particule quantique rebrousse chemin sur l’obstacle, alors qu’elle 
est transmise à coup sûr dans le cas classique. Remarquons que le coefficient R est 
proche de 1 quand E = V et tend vers 0 lorsque E/V tend vers l’infini. Ce phénomène 
porte le nom de réflexion quantique. I] est l’analogue, pour les ondes de matière, du 
phénomène bien connu de réflexion des ondes électromagnétiques lors de leur pas- 
sage d’un milieu transparent à un autre d’indice optique différent. 

— Considérons maintenant le cas £ < V : la solution dans la région IT est alors une 
somme d’exponentielles réelles : 


=1-R (14.28) 


nr (x) = Ce ** + De“* (14.29) 


avec k = Y2m(V - E)/h. Lorsque D # 0 l’amplitude de l’onde de matière diverge 
lorsque x croît. Nous chercherons donc une solution avec D = 0. En utilisant les 
conditions de continuité en x = 0 de la fonction d’onde 6 (x) et de sa dérivée #’ (x), 
il est possible de trouver une telle solution. On trouve en particulier : 


- C _ 2ik 


=]: = 14.30 
A ik — K 
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14.8. Mesure de la vitesse de la particule, notion d’observable 


On remarque d’abord que le coefficient de réflexion est de module 1, ce qui implique 
que la particule est réfléchie par la barrière avec certitude, comme dans le cas clas- 
sique. Mais on constate aussi que C Æ 0 : la fonction d’onde est non nulle dans la 
région Il, classiquement interdite. Il y a donc une probabilité non-nulle de détecter 
la particule dans la région IT, c’est-à-dire « dans » la marche ! Cette onde transmise 
Ce”** n’est pas une onde plane progressive et son amplitude décroît exponentielle- 
ment en x; elle s’annule au bout d’une distance de quelques «-! : c’est une onde 
évanescente de matière, dont l’analogue, en électromagnétisme, correspond à l’onde 
évanescente existant dans un dioptre lors de la réflexion totale d’une onde électroma- 
gnétique. 

Considérons alors non pas une marche, mais une barrière de potentiel de hauteur V, 
qui revient à la valeur V(x) = 0 pour x > £, avec £ de l’ordre de «°! : on s’attend 
à ce que l’onde évanescente de matière ait une valeur non négligeable en x = Let 
se raccorde, en utilisant toujours les relations de continuité, à une onde progressive 
d'amplitude non nulle pour x > €. La particule a alors une probabilité non nulle 
d’être transmise au-delà d’une barrière qu’elle ne peut classiquement franchir ! C’est 
ce qu’on appelle l’effet tunnel. Ce phénomène est à la base du microscope à effet 
tunnel (figure 14.5). 


14.8 MESURE DE LA VITESSE DE LA PARTICULE, 
NOTION D’OBSERVABLE 


Jusqu'ici, les seules mesures que nous avons présentées en détail sont celles de po- 
sition et d’énergie. Il existe bien évidemment d’autres grandeurs remarquables pour 
une particule, en premier lieu desquelles sa vitesse (ou sa quantité de mouvement). 


14.8.1 État ayant une valeur certaine de la vitesse 


On se place à un instant donné f = 0, et à une seule dimension d’espace. Un état 
quantique |Ÿ,) de vitesse v bien déterminée selon Ox a une quantité de mouvement 
mv donc un vecteur d’onde bien défini dans la direction Ox : k, = mu/h. La fonction 
d’onde associée est par conséquent une onde plane qui s’écrit, d’après (14.4) : 


Yo(x) = Yo exp (=) (14.31) 


où ÿ est un facteur numérique sans signification physique. 
Le vecteur d’état correspondant s’écrit : 


FAT [ dx exp (=) Lo (14.32) 


CO 
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Figure 14.5 - L’une des plus importantes applications de l'effet tunnel est le 
microscope à effet tunnel dans lequel on déplace une pointe très fine près de la surface 
d’un échantillon conducteur. Les électrons peuvent alors passer, par effet tunnel, d’un 
conducteur à l’autre, c’est-à-dire de la pointe à l'échantillon, créant ainsi un courant 
macroscopique qui dépend de façon exponentielle, donc très sensible, de la distance 
pointe-échantillon. En ajustant en temps réel la hauteur de la pointe pour maintenir un 
courant constant et en enregistrant cette hauteur, on peut alors reconstituer le profil 
d’une surface. On est ainsi capable aujourd'hui de réaliser des « images » de surfaces à 
la précision d’ «un » atome comme illustré sur les deux images expérimentales : à 
gauche, des atomes de silicium observés à la surface d’un cristal de carbure de silicium, 
et à droite, un nanotube de carbone. 

(source libre : http://en.wikipedia.org/wiki/Scanning_tunneling_microscope) 


14.8.2 Probabilité de mesure de la vitesse sur un état 
quelconque 


Appliquons ici ce que l’on sait d’une mesure quantique : pour un système dans un 
état quelconque |}, la mesure de la vitesse n’est certain que si |Ÿ) coïncide avec un 
état |[Ÿ,,). Dans le cas général, la (densité de) probabilité P(v) de trouver la vitesse v 
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14.8. Mesure de la vitesse de la particule, notion d’observable 





vaut : - 

Po) = KA = 1 [ax couco (14.33) 
Soit, plus explicitement : 

. m Ex mux . 

P() = — | dx exp(—-i—— )Y(x) (14.34) 

27h | J_ ñh 
où le facteur numérique m/27rh permet d’obtenir : 
[do = (14.35) 


signifiant que la probabilité de trouver n’importe quelle valeur de v dans une mesure 
de vitesse est égale 1. 

Remarquons que le résultat (14.34) est extrêmement surprenant : c’est la même 
quantité mathématique complexe, (x), qui contient les prédictions physiques concer- 
nant la position ef la vitesse de la particule, alors qu’en physique classique on peut 
fixer de manière totalement indépendante position et vitesse d’un point matériel. 
Cette propriété implique que mesures de position et mesures de vitesse ne sont plus 
totalement indépendantes. Elles sont en fait liées par l’inégalité de Heisenberg que 
nous avons vue au chapitre 13. 

La transformation mathématique qui permet de passer d’une fonction f(x) à la 
fonction f(k) = P dxe"'#* f(x) est bien connue des mathématiciens et des physiciens 
qui l’utilisent dans de nombreux domaines : 1l s’agit de la transformée de Fourier, 
dont la transformation inverse s’écrit f(x) = Î dk e+ikx f@)/2x. L'expression (14.34) 
nous indique donc que la probabilité de mesurer une vitesse v est proportionnelle au 
carré de la transformée de Fourier ÿ(k) de la fonction d’onde #(x), avec k = mu/ñ. 

Il est important de noter que la connaissance des coefficients ÿ(k) est équivalente 
à la connaissance de la fonction d’onde y (x). Ces représentations ne sont en fait que 
deux exemples parmi l’infinité de représentations possibles du vecteur d’état |W), et 
contiennent exactement la même information sur l’état du système. Aïnsi, la fonction 
d’onde ÿ (x) apparaît comme une représentation particulière (appelée représentation 
position, puisqu'elle fait intervenir la variable position x) du vecteur d’état [ÿ) : 


w= [ucoia (14.36) 


dans la base {|x)}, où |x) est le vecteur d’état d’un système physique dont la position 
est détectée à coup sûr en la position x à dx près (c’est-à-dire par un détecteur de 
taille infinitésimale dx). 
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S’affranchir d’une représentation particulière en travaillant en termes de vecteurs 
d'état plutôt qu’en termes de fonctions d’onde est très important puisque cela permet 
de traiter des problèmes où la notion même de fonction d’onde n’est plus pertinente 
(comme dans le cas de la polarisation des photons du chapitre 11, ou celui du spin 
des atomes d’argent du chapitre 12). 


14.83 Exemple de la boîte quantique 


Connaissant la fonction d’onde d’un état donné du système, on en déduit par transfor- 
mée de Fourier la probabilité de mesurer la vitesse. On peut le faire, par exemple, pour 
les trois premiers niveaux de la boîte quantique du paragraphe 14.5 (avec k = mu/h). 
On trouve : 


27L cos (KL/2)  S8rL sin’(Kl/2) ; 18xL cos’ (kL/2) 


Pi) = — : Pa(v) = — 
1(0) ñ ŒL2 mp 2(L) h (EL -4mÿ 


V7  h (EL-9r}ÿ 

(14.37) 
On constate, sur la figure 14.6, que dans l’état fondamental la vitesse la plus probable 
est 0, qui est la vitesse de l’état classique de plus basse énergie, mais que la vitesse 
peut prendre des valeurs positives ou négatives notablement différentes de zéro, de 
l’ordre de ñ/mL. Dans les états n = 2 et n = 3 de plus grande énergie, on a deux pics 
centrés plus ou moins sur la vitesse de la particule classique de même énergie, mais 
toujours avec une dispersion notable des résultats de mesure autour de la valeur la 
plus probable. Pour de fortes valeurs de n, ces deux pics sont très espacés et on tend 
vers la situation classique où la vitesse de la particule prend seulement deux valeurs 
opposées (figure 14.7). 





P1(v), P2(v), P3(v) 


TU 





= = + b nm 
L 1 1 1 


3 2 1 Ô 1 2 3 





Figure 14.6 - Densités de probabilité de vitesse P,(v), P;(v), P; (v) du puits carré infini. 
L’axe des abscisses est en unités h/2mL. 
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14.8. Mesure de la vitesse de la particule, notion d’observable 





P20(v) 

















_20 0 20 


Figure 14.7 - Densité de probabilité de vitesse P0(v) du puits carré infini. L’axe des 
abscisses est en unités h/2mL, et la distribution P,(v) figure en pointillés. 


14.8.4 Valeurs moyennes et écarts-types de la quantité 
de mouvement 


À partir de l’équation (14.34), on peut calculer les valeurs moyennes de n’importe 
quelle puissance de v : 


'}= [ v' P(v) dv (14.38) 


et donc l’écart-type Av estimant la largeur de la distribution de v : 


Av = {02} - (ÿ? (14.39) 


Par exemple, dans le cas de la boîte quantique de largeur L on obtient les écarts- 
types : 


L 6 h 
— TE 1 — e et APx = (14.40) 


2L 
où Ax et Ap, représentent les largeurs caractéristiques des distributions de probabilité 
PAG) et P;(). 
Le produit AxAp, = . a) Le — 2 de ces largeurs augmente avec n. On vérifie alors 
que sa valeur minimale, obtenue pour n = 1, est bien compatible avec le principe 
d’indétermination de Heisenberg, c’est-à-dire qu’elle est supérieure à h/2 : 


h [nr ñ 
n= 1 : AxApP, = 5 2 —2=0,57h > 5 (14.41) 
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Chapitre 14 + Évolution temporelle de la fonction d'onde 


=. 
XENcarT 14.1 Notion d’observable 


On remarque que la fonction d'onde #,(x) est solution de l’équation : 
te) 
—ih= vx) = mvy,(x) (14.42) 


c'est-à-dire, en langage mathématique, que w,(x) est une fonction propre de 
l'opérateur -inÀ, la valeur propre associée étant la quantité de mouvement 
p = mv. 

Ce n’est pas fortuit, car on peut montrer, et c’est l’un des principes fondamen- 
taux de la mécanique quantique, que les seuls résultats possibles d’une me- 
sure sont en fait les valeurs propres d'opérateurs particuliers, appelés des ob- 
servables, que l’on représente habituellement par des lettres surmontées d’un 
« chapeau ». 

On peut ainsi définir l'opérateur quantité de mouvement suivant la direction Ox : 
px, dont l'effet sur une fonction d’onde est donné par la relation : 


x 0 
Px (x, t)) = cihe OÙ (14.43) 


L'opérateur position X est quant à lui défini par la relation : 
X (x, D) = x.y(x,t) (14.44) 


où la quantité x désigne la variable x et non pas l’opérateur X. L'action de l’opé- 
rateur position sur une fonction d'onde est donc très simple : elle consiste uni- 
quement à multiplier la fonction d'onde par la variable position!? 

Par exemple, si l’on considère l'expression non-relativiste de l’énergie totale 
E = pi/2m+ V(x) (à une dimension), alors on peut lui associer une observable : 
l'opérateur Hamiltonien À, que l’on obtient en remplaçant les variables classiques 
x et p, par les opérateurs X et f, dans l'expression classique de E > : 


ou 
D : 
H= 2 +v() (14.45) 


L'action de À sur une fonction d'onde quelconque redonne alors bien le membre 
de droite de l’équation (14.7) : 


FL 


AGO) = 2 A Ux,D + VOOUOD (14.46) 


2. D’autres opérateurs peuvent alors être déduits de ces deux définitions (certaines grandeurs, en re- 
vanche, ne peuvent être déduites de £ et p,, c’est le cas des opérateurs de spin ou de polarisation du 


photon par exemple). 
3. Le principe des opérateurs associés est en fait plus subtil et consiste à associer aux variables classiques 
des opérateurs correctement symétrisés. Par exemple, à la grandeur classique x p, est associé l’opérateur 
(ÀPx + Ds) /2. 
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14.8. Mesure de la vitesse de la particule, notion d’observable 


L'introduction de l’opérateur Hamiltonien permet finalement d'exprimer l’équa- 
tion de Schrôdinger de façon très générale, c’est-à-dire en termes de vecteur 
d'état : 


au à 
lire le (0) = Hg (E)) (14.47) 


où À est l'opérateur Hamiltonien du système physique décrit par le vecteur d'état 
lg (t)), et dont nous avons vu une expression matricielle à la section 12.4. 
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DE LA MÉCANIQUE 
QUANTIQUE 


Dans les chapitres précédents, nous nous sommes intéressés à la position du pho- 
ton et à sa polarisation, puis au moment magnétique de spin d’un atome, et enfin à 
la position, à l’énergie et à la vitesse d’une particule massive, qu’elle soit libre ou 
confinée. Il est temps de conclure cet ouvrage par une revue plus générale des pro- 
priétés des objets quantiques, et d’énoncer sous forme de postulats les règles qui sont 
susceptibles de servir lorsqu'on traite n’importe quel système microscopique. 


15.1 À LA BASE DE TOUT : LE VECTEUR D'ÉTAT 


15.1.1 Énoncé 


Postulat 1a 

Tout système quantique, aussi complexe soit-il, est complètement décrit par la 
donnée d’un seul objet, le vecteur d’état, noté |7), élément d’un espace de 
Hilbert. 


Rappelons qu’un espace de Hilbert est un espace vectoriel à coefficients complexes 
muni d’un produit vectoriel complexe. Le produit scalaire complexe de deux vecteurs 
|7,) et | 75) est noté (7,1[7;). Il est tel que : 


CPP) = (PP) (15.1) 


Il existe, en outre, une contrainte et une liberté pour les vecteurs d’état décrivant un 
objet physique : 


Postulat 1b 
Pour tout vecteur d’état | 7) décrivant un objet physique : (717) = 1. 
|#) et e/?|Ÿ) décrivent le même état physique quel que soit 4. 
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|[P) est donc normé à 1 et est défini à un facteur de phase près. 

Notons la différence importante de description entre un système classique, où 1l est 
nécessaire de connaître de nombreux paramètres différents du système si on veut le 
décrire complètement (position, vitesse, moment magnétique, valeur d’une onde en 
tout point...) et un système quantique, où le vecteur d’état d’un système physique est 
un objet unique qui contient toutes les informations mesurables sur ce système. 


15.1.2 Conséquences immédiates 


L’appartenance à un espace vectoriel semble une propriété technique de l’état. En fait, 
elle est un des aspects les plus fondamentaux de la mécanique quantique, car elle a de 
nombreuses conséquences. Propriété commune à tous les phénomènes ondulatoires, 
elle implique en particulier le « principe de superposition » : 


Si |Ÿ1) et |Ÿ2) sont deux vecteurs d'état d’un même système quantique, toute 
combinaison linéaire «1|Ÿ1}) + a2|Ÿ3) normée à 1 de ces deux vecteurs d'état est 
aussi un état possible du système. 


La linéarité de la mécanique quantique implique en outre le théorème de non- 
clonage, abordé au chapitre 12 : 


[n’est pas possible de dupliquer un état quantique inconnu, c’est-à-dire produire 
à partir de cet état deux états « copies » strictement identiques à cet état entrant. 


15.1.3 Décomposition sur une base de l’espace de Hilbert 


Une caractéristique importante d’un système physique est la dimension N de l’es- 
pace de Hilbert associé, c’est-à-dire le nombre de coefficients complexes qu’il faut 
connaître pour déterminer exactement le vecteur d’état. Celle-ci peut être finie, 
comme dans le cas de la polarisation du photon ou du moment magnétique de spin 
d’un atome (dans ces deux cas N = 2), ou infinie dénombrable, comme dans le cas de 
la boîte quantique. Elle peut même être infinie avec la puissance du continu comme 
dans le cas d’une particule libre. Nous allons considérer dans ce paragraphe seule- 
ment le cas dénombrable. 

Il existe une infinité de bases différentes pour représenter un élément d’un espace 
vectoriel. Les bases les plus adaptées à la description d’un état quantique sont les 
bases orthonormées {|u;)} (i = 1,N), telles que : 


(uilu;) = 0;; avec Oj=1l et 6;;=0 pour i#j (132) 


Tout vecteur d’état quantique |Ÿ} peut se décomposer sur cette base : 


N 


N 
IPS = », cilu;) avec cj = (u;|?) et 2. Ic;l? = | (15:3) 
i=l 


i=] 
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15.1. À la base de tout : le vecteur d'état 


Les coefficients {c;};=1..,n Sont les coordonnées du vecteur |} dans la base {|u;)}. La 
base orthonormée permet d’écrire simplement le produit scalaire complexe de deux 
vecteurs d’état |7) et |®), de coordonnées respectives {c;k:=1,.,n et {diki=1,.,n : 


N 


(PI) = Ÿ_ cid; (15.4) 


i=1 


15.1.4 Cas particulier : la fonction d'onde 


Considérons l’équivalent quantique d’un point matériel de masse m pouvant se dépla- 
cer uniquement le long de l’axe Ox. Nous avons vu dans le chapitre 14 que, comme 
on peut mesurer a priori Sa position en n’importe quel point x de cet axe, l’espace 
de Hilbert associé est de dimension infinie continue. Une base possible est celle des 
états {|x)} (x €] — ©, + co[) correspondant à des états parfaitement localisés au point 
x, et qui vérifient : 

(A4x)=0 pouxzix (15.5) 


Le carré scalaire (x|x) de ces vecteurs est infini. Ils ne sont donc pas associés à des 
états physiques mais représentent des intermédiaires de calcul commodes. 

Tout vecteur d’état quantique |Ÿ) de la particule peut se décomposer sur cette base, 
non sous la forme d’une somme discrète, mais d’une intégrale : 


+ 


dx |#(x) = 1 (15.6) 


CO 


+00 
ES = (à dxwy(x)|x) avec w(x) = (x[P) et [ 
où ÿ(x) est la fonction d'onde, fonction complexe de carré sommable de la variable 
x dont l’ensemble des valeurs constitue les coordonnées du vecteur |?) dans la base 
{Ix)}. Cette base permet d’écrire simplement le produit scalaire complexe de deux 
vecteurs d’état |) et |®), de fonctions d’onde respectives Y(x) et @(x) : 


+00 
(PIB) = [ dx #" (px) (15.7) 
00 

Comme le vecteur d’état, la fonction d’onde est définie à un facteur de phase près. 
C’est une fonction continue en tout point, et sa dérivée spatiale est continue partout, 
sauf en un nombre fini de points isolés. 

Les fonctions d’onde obéissent également à un principe de superposition : Si di (x) 
et ÿ2 (x) sont deux fonctions d’onde possibles pour un système, alors toute combinai- 
son linéaire (à coefficients complexes, normalisée à un) de ces fonctions d’onde est 
aussi une fonction d’onde possible pour ce système. Cette possibilité de superposi- 
tion rend possible l’existence d’interférences destructives entre fonctions d’onde de 
phases opposées analogues aux interférences destructives pour l’onde lumineuse. 


237 


Dunod. 


2015 


right € 


» 


Copyr 


Chapitre 15 + Les règles générales de la mécanique quantique 


On peut évidemment utiliser d’autres bases que la base {|x)}, par exemple une 
base plus adaptée à la mesure de vitesses. Ces différentes représentations contiennent 
exactement la même information sur l’état du système. On peut facilement étendre 
la discussion précédente à une fonction d’onde Y (x,y,z) définie dans l’espace à trois 
dimensions des positions de la particule. 

Précisons enfin que tous les systèmes quantiques ne sont pas descriptibles en 
termes de fonction d’onde : c’est le cas par exemple d’une particule matérielle ayant 
un spin. Bien que pratique, car elle ramène l’onde quantique à la notion plus fami- 
lière qu’est le « champ » ÿ (x,f) ayant une valeur définie en tout point de l’espace, la 
notion de fonction d’onde est donc moins fondamentale que celle de vecteur d’état. 


15.2 ÉVOLUTION TEMPORELLE 


Au cours du temps, le vecteur d’état change en général, et il faut donc le noter [y (f)). 
Que ce soit en physique quantique ou classique, l’évolution dans le temps de l’état 
d’un système est reliée à l’expression de son énergie. Nous avons vu qu’à cette éner- 
gie, grandeur mesurable, est associée une observable, notée À , appelée Hamiltonien. 


15.2.1 Énoncé 


Postulat 2 
L'évolution du vecteur d’état |ÿ (f)) décrivant un système physique est donnée par 
l’équation de Schrüdinger 


d À 
kW G)} = HIYG)) (15.8) 


où À est l’Hamiltonien du système, qui est l’observable associée à l’énergie du 
système. 


15.2.2 Conséquences 


Précisons que cette loi d'évolution ne s’applique que pour un système quantique sou- 
mis à des contraintes fixes, comme l’effet d’une force dérivant d’un potentiel fixe. Il 
ne s’applique pas lorsque le système est soumis à l’interaction avec un appareil de 
mesure, dont l’état est par nature modifié par son interaction avec la particule quan- 
tique. 

Il faut insister sur le fait que si la mécanique quantique est de nature probabiliste 
pour les résultats de mesure sur un système individuel à un instant donné l’évolution 
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15.3. La mesure, lien entre le système physique et l'observateur 


du vecteur d’état est, elle, parfaitement déterministe. En effet, si l’on connaît le vec- 
teur d’état du système à un instant donné f = 0, ainsi que l’Hamiltonien du système, 
alors l’équation de Schrüdinger permet de déterminer le vecteur d’état du système à 
tout instant. 

Nous avons vu au chapitre 12 que si on connait les états |[w,) d’énergie bien défi- 
nie E, du système, la résolution de l’équation de Schrüdinger aboutit à l’expression 
explicite suivante du vecteur d’état au temps f : 


WG) = D eue En on) (15.9) 


n 


En termes de fonctions d’onde, nous avons vu que dans le cas d’un mouvement à 
une dimension le long de la direction x l’équation de Schrüdinger d’une particule de 
masse m soumise à un potentiel V(x) s’écrit : 


| Ô h? 2 
ie WCxt) = 3m 97 VEoi) + VG)y (at) (15.10) 


On peut aussi l’écrire sous la forme du postulat 2 : 
… Ô - 
hr Qt) = Hy(x,t) (15.11) 


Dans cette dernière écriture, l’opérateur Hamiltonien Æ est un opérateur linéaire agis- 
sant sur l’espace des fonctions : 


ns mo + 
À = + vo =-E 


mn 36 = + V(x) (15.12) 


où V(x) est l’opérateur qui multiple la fonction par V(x), et D, est l’opérateur quantité 
de mouvement introduit à l’encart 14.1, égal à l’opérateur différentiel ih 2. 


15.3 LA MESURE, LIEN ENTRE LE SYSTÈME 
PHYSIQUE ET L'OBSERVATEUR 


La mesure d’une grandeur physique quelconque, que nous appellerons de manière gé- 
nérale À, comme la position, la vitesse, l’énergie, le moment magnétique, le courant 
électrique. présente des aspects spécifiques — dès lors qu’on s’intéresse au monde 
quantique — qui sont liés à l’aspect inévitablement aléatoire des résultats de mesure 


sur les objets quantiques individuels. 
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15.3.1 Postulats relatifs à la mesure 


Postulat 3a 

Il existe des états quantiques spécifiques, notés |,), pour lesquels la mesure de 
la grandeur physique À donne avec certitude le résultat réel a. L’ensemble des 
vecteurs {|[b,)} forme une base orthonormée de l’espace de Hilbert des états du 
système. 


Dans la suite, nous supposerons, pour simplifier les notations, que la liste des valeurs 
de a possibles forme un ensemble discret (a;,i = 1,2,...), et aussi qu’il n’y a qu’un 
seul état par valeur a; que nous noterons lbi)!. 


Postulat 3b 

Lorsque le système physique est dans un état décrit par un vecteur d’état |W) 
quelconque, la mesure ne donne en général pas un résultat certain. La probabilité 
Proba(ai;,l)) d'obtenir le résultat a; est donnée par : 


Proba(a:,l)) = Kb) 


Il existe des cas où la mesure ne détruit pas le système mesuré. Dans ce cas on peut 
s'intéresser à l’état du système après la mesure 


Postulat 3c 

Dans les cas où la mesure a donné effectivement le résultat a;,, le système après 
la mesure est dans un état conditionnel (restreint au sous-ensemble des cas où 
on à mesuré 4j) qui est égal à l’état [D;,), et cela indépendamment de l’état du 
système avant la mesure. 


15.3.2 Caractéristiques spécifiques de la mesure 
en mécanique quantique 


Selon les situations, les valeurs possibles d’une mesure en mécanique quantique 
peuvent être très différentes : 


e elles sont quantifiées et forment un ensemble discret dans le cas où À est l’éner- 
gie d’un système lié, l’état de polarisation d’un photon, la projection du moment 
magnétique d’un atome sur une direction donnée ; 


1. On dit, dans ce cas, que les valeurs propres a; sont non-dégénérées. 


240 


2015 Dunod. 


Copyright € 


© Dunod. Toute reproduction non autorisée est un délit. 
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e elles peuvent prendre toutes les valeurs réelles dans d’autres cas, par exemple 
lorsque À est la position d’une particule, le champ électrique d’une onde ; 


e le cas intermédiaire peut aussi se présenter, dans lequel les valeurs possibles 
peuvent former un (ou plusieurs) intervalles déterminés [ain, max] de valeurs 
réelles (voir les notions de bandes de conduction et de valence introduites au cha- 
pitre 10). 


Le caractère intrinsèquement aléatoire des mesures effectuées sur un système 
quantique individuel est l’un des aspects les plus fondamentaux, mais aussi les plus 
inhabituels, du monde quantique : lorsque le système se trouve dans un état quantique 
quelconque, différent des états |D;) introduits par le postulat (3a), le résultat d’une 
mesure unique de la grandeur À n’est en général pas prévisible. Il s’agit donc d’une 
limitation fondamentale au pouvoir prédictif de la physique. Fort heureusement, si 
on répète un grand nombre de fois la mesure sur un système toujours préparé de la 
même manière, ou si la mesure porte simultanément sur un très grand nombre de 
systèmes individuels, la probabilité donnée par le postulat (3b), et donc les moyennes 
statistiques effectuées sur ces résultats, sont parfaitement déterminées. On retrouve à 
ce niveau, plus « macroscopique », le déterminisme de la théorie physique. 


Pour mesurer une grandeur sur un objet du monde quantique 1l faut franchir les huit 
ordres de grandeur mentionnés dans le paragraphe d’introduction au monde quan- 
tique qui nous séparent de ce monde. C’est le rôle de l’instrument de mesure, par 
exemple un compteur de photons ou d’électrons. Il s’agit donc d’un système macro- 
scopique qui est susceptible de perturber fortement l’objet mesuré. Qu’un appareil 
de mesure perturbe l’objet mesuré est une caractéristique bien connue en physique 
classique : l’insertion d’un ampèremètre dans un circuit électrique modifie le courant 
qui y circule, ou bien l’insertion d’un thermomètre modifie la température à mesu- 
rer. Mais cette modification peut être calculée, et le résultat de mesure corrigé en 
conséquence. 


Il n’en va pas de même au niveau quantique, où la mesure perturbe l’objet mi- 
croscopique d’une manière incontrôlable et non prévisible au niveau de la mesure 
individuelle. En revanche, dès lors qu’on connaît le résultat de la mesure sans que 
le système ne soit détruit par cette mesure, la perturbation de l’appareil de mesure 
aboutit à un résultat étonnamment simple et universel, puisque, d’après le postulat 
(3c) l’état après la mesure est l’état [d;,), indépendamment de l’état avant la mesure. 
Ce postulat est appelé parfois principe de réduction du vecteur d'état. Insistons sur 
le fait que si on répète alors la mesure, on aura à coup sûr la même réponse que celle 
obtenue lors de la première mesure. 
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15.33 «Éléments propres » d’une mesure, observable 


À toute grandeur physique À mesurable sont donc attachés la liste des résultats pos- 
sibles a; et les états associés |D;). Il est alors commode d’introduire un opérateur 
linéaire, noté À, agissant sur l’espace de Hilbert des états du système, et défini par 
son action sur la base des vecteurs |;) : 


Âlp:) = ail) (15.13) 


À est donc une matrice diagonale sur la base {|9;)}. Les a; sont les valeurs propres de 
l’opérateur À, et les vecteurs d’état |[g;) sont les vecteurs propres associés. L'opérateur 
Hamiltonien que nous avons introduit à la section 12.4, est donc l’observable associée 
à la grandeur physique « énergie du système » . 

L'introduction de l’observable permet en particulier de donner une expression 
simple à la valeur moyenne, ou espérance mathématique ÆEy,(A), notée en méca- 
nique quantique (À), de la mesure de A lorsqu'elle est effectuée un grand nombre de 
fois sur le système préparé à chaque fois dans un état |) quelconque donné. On peut 
montrer qu’elle est égale au produit scalaire des vecteurs d’état À |#} et |7}, que l’on 
note habituellement {Y1|À |#). 


(À) = Eyyy(A) = . aiProba (ai, ÿ)) = (PAP) (15.14) 


I 
Dans le cas de l’espace de Hilbert des fonctions d’onde, les opérateurs linéaires 
sont définis par leur action sur une fonction d’onde quelconque. Ils peuvent, par 
exemple, faire intervenir des dérivées de la fonction considérée. Par exemple, on 
définit l’opérateur position par : 


À (J (xD) = xp (XD) (15.15) 


Quant à la quantité de mouvement dans la direction x, l’opérateur associé s’écrit : 


Ô 
Pr (Y (xt) = he ( (xt) (15.16) 
x 


où la quantité x désigne la variable x et non pas l’opérateur £. En effet, l’état donnant 
une valeur certaine à la quantité de mouvement p introduit en 14.1, qui a pour fonc- 
tion d’onde Y,,(x) = WoeP% est état propre de cet opérateur avec la valeur propre p : 


Ô 
ie bpQ) = phpQ) (15.17) 


La valeur moyenne de la position de la particule, par exemple, s’écrit alors, en 
utilisant l’expression du produit scalaire pour la fonction d’onde : 


En) = (I (RIW)) = 1 D'OxA CD dx = [ xl (9 Pax (15.18) 
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15.3.4 Mesures successives de grandeurs physiques 


Nous avons vu en section 13.3 que l’inégalité de Heisenberg contraignait la connais- 
sance que l’on pouvait avoir de deux variables complémentaires, comme la position 
et la vitesse d’une particule. Nous allons voir ici ce qu’il advient lorsque l’on essaye 
néanmoins de mesurer, le plus précisément possible, ces quantités. En particulier, 
des caractéristiques nouvelles de la mécanique quantique se manifestent lorsqu’on 
considère le problème de mesures successives sur le même système. 

Nous supposons donc que la première mesure effectuée ne détruit pas le système 
mesuré, de sorte qu’on peut appliquer le postulat (3c), et que l’état du système n’évo- 
lue pas entre les deux mesures. 

Envisageons d’abord le cas où on effectue deux fois la mesure de la grandeur À : si 
la première a donné le résultat a;,, le système se retrouve dans l’état [b;,), de sorte que 
la deuxième mesure donnera à coup sûr le même résultat. La fonction perturbatrice 
de la mesure ne se produit qu’à la première mesure, qui sert donc de « préparation » 
du système pour des mesures ultérieures qui ne sont plus entachées d’erreurs. 

Considérons maintenant le cas de mesures successives de grandeurs physiques A 
et B différentes. La première mesure transforme l’état initial en l’état propre |6:,) 
associé à la valeur mesurée a; . Il y a alors deux situations possibles : 


e soit (bi) est aussi vecteur propre de l’observable Ê associée à la mesure de B et de 
valeur propre b;,, et la mesure de B donne à coup sûr le résultat b;, : les mesures 
sont dites compatibles, car elles ne se perturbent pas l’une l’autre ; 


e soit |g;,) n’est pas vecteur propre de l’observable B, et la mesure de B donne des 
résultats aléatoires : les mesures sont dites incompatibles. TI est facile de voir que 
dans ce cas, on n’obtient pas les mêmes probabilités de mesure lorsque l’on change 
l’ordre dans lequel ces mesures sont effectuées. On appelle grandeurs conjuguées 
de tels couples de grandeurs incompatibles. 


Un exemple important est le couple position-quantité de mouvement (x,p,). En effet, 
une mesure de position d’une particule donnant la valeur x, transforme l’état initial 
en l’état |xo), qui, comme nous l’avons vu au chapitre 14, n’est pas un état propre 
de la quantité de mouvement : la mesure de position s’accompagne donc de mesures 
ultérieures de la quantité de mouvement qui sont totalement aléatoires. Inversement, 
une mesure de quantité de mouvement donnant la valeur po transforme l’état initial 
en l’état |po) de fonction d’onde w,,(x) = gogo, qui n’est pas un état propre de 
la position : la mesure de quantité de mouvement s’accompagne donc de mesures 
ultérieures de la position dont la probabilité 0 OP = of est indépendante de x 
et qui sont totalement aléatoires. On ne peut donc pas, même avec des appareils de 
mesure idéaux, connaître à la fois la position d’une particule de façon infiniment pré- 
cise (c’est-à-dire avec une indétermination nulle sur la position : Ax = 0) et en même 
temps sa quantité de mouvement de façon infiniment précise (c’est-à-dire avec une 
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indétermination nulle sur la quantité de mouvement : Ap, = 0). Cette impossibilité 
condamne toute notion de frajectoire précise pour une particule en mécanique quan- 
tique, nous arrivons ainsi à la même conclusion qu’avec l’inégalité de Heisenberg. 
Que se passe-t-il si on fait une mesure moins précise de position ? Si on mesure la 
position dans l’intervalle [—-Oxmesure/2,0Xmesure/21, la Mesure projette le système dans 
l’un des états |x,) définis dans l’encart 13.1 (figure 13.17). Une mesure sur cet état de 
la composante selon Ox de l’impulsion donne des résultats centrés sur p, = 0 avec un 
écart-type ÔPx, perturb de l’ordre de h/6Xmesure. On à alors : ÜXmesureÔ Px,perturb = 27h 
On peut montrer qu’il existe une inégalité de Heisenberg-Ozawa concernant l’écart 
type AXmesure, Qui caractérise la précision d’une mesure de x, l’écart type Ap,, perturb: 
qui caractérise la dispersion des valeurs de p, de l’état du système perturbé par cette 
mesure, et les écarts types Ax et Ap, qui caractérisent la dispersion des valeurs de 
x et p, dans l’état initial du système, celles qui sont concernées par l’inégalité de 
Heisenberg « habituelle » (13.16). L’inégalité de Heisenberg-Ozawa s'écrit : 


AXmesureNPx, perturb sa AXAPx,perturb + AXmesureNPx 2 h/2 (15.19) 


Cette relation empêche que l’on ait une mesure à la fois parfaite et non perturba- 
trice (AXmesure = APx,perturb = 0). On peut, en revanche, avoir une mesure parfaite 
AXmesure = O avec une valeur de AD; perturb telle que AXAD,,perturb > À/2. Ainsi la 
relation (15.19) n’interdit pas que AxmesureNPx,perturb < h/2, à condition que Ax et 
Ap, soient suffisamment grands : plusieurs expériences récentes ont effectivement 
mis en évidence qu’on pouvait être dans ce régime, où l’effet perturbateur de la me- 
sure est en quelque sorte « caché » dans la grande dispersion initiale des valeurs de 
x et de p,. L’inégalité (15.19) ressemble à l’inégalité de Heisenberg et elle est sou- 
vent confondue avec cette dernière. Elle est cependant différente conceptuellement, 
car la relation (13.16) est une propriété de tout état quantique, découlant de la dualité 
onde-particule. Elle ne concerne pas l’effet de la mesure sur l’état et ne dépend pas 
du postulat 3c, alors que l’inégalité (15.19) en est une conséquence directe. 


15.3.5 Une expérience de localisation spatiale 
d’une particule isolée 


La figure 15.1 donne un exemple d’expérience de localisation d’une particule unique, 
en l’occurrence un atome (ou un ion) : elle consiste à exciter l’atome avec un faisceau 
laser se propageant le long de l’axe Ox. L’atome est alors porté dans un état excité 
d'énergie E3. Il retombe ensuite par émission spontanée dans son état fondamental 
d'énergie E, en émettant un photon de fréquence y = (E3 — E;)/h. Ce photon est 
émis dans une direction aléatoire. Le laser peut alors exciter à nouveau l’atome, et 


2. M. Ozawa, Physical Review 67, 042105, 2003 
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Figure 15.1- Schéma de principe du microscope de Heisenberg. Le fonctionnement est 
détaillé dans le texte ci-contre. 


le processus se répète, conduisant à l’émission de nombreux photons par la même 
particule isolée. L’atome est au foyer d’une lentille, qui permet de recueillir tous les 
photons émis dans une direction faisant un angle & avec Oy tel que & < a», où 
@m dépend du diamètre de la lentille. Ces photons sont ensuite refocalisés par une 
deuxième lentille identique sur la surface d’un capteur CCD : on peut ainsi acquérir 
l’image de l’atome unique. La taille de cette image donne la précision Axesure AVeC 
laquelle on peut localiser l’atome. Celle-ci est donnée par les lois de l'optique, et plus 
précisément celles de la diffraction : 


AXmesure = — (15.20) 
Sin(@»h) 

où sin(@,,) est appelée ouverture numérique de la lentille. La précision de la loca- 
lisation est donc de l’ordre de la longueur d’onde de la lumière émise, c’est-à-dire 
le micromètre, une valeur bien supérieure à la taille de l’atome, de l’ordre du nano- 
mètre. Pour améliorer cette précision, il faudrait utiliser de la lumière de plus courte 
longueur d’onde. La figure II.2 de l'introduction donne un exemple d’image de parti- 
cules isolées (en l’occurrence trois ions) enregistrée par le procédé que nous venons 
d'indiquer. 

Cette mesure perturbe-t-elle l’ion unique ? Oui, car l’émission de chaque pho- 
ton satisfait à la conservation de la quantité de mouvement totale du système 
«ion+photon », section 10.12.2) : l’atome recule, comme un canon, à chaque émis- 
sion de photon. La variation de quantité de mouvement de l’atome ôp est égale à 
l'opposé de la quantité de mouvement #k du photon émis : sa vitesse est modifiée, 
d’une quantité faible mais non nulle, et surtout aléatoire donc imprévisible. En sup- 
posant que cette émission se fasse dans le plan x0y, on a : 


Ôp,x = —hksin & (15.21) 
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L’incertitude sur p, induite par l’émission spontanée de photons, Ap,, perturb; St donc 
de l’ordre de äk sin «&,,. On a alors : 


AXmesure Px, perturb = Ahk = 27h (15.22) 


en conformité avec l’inégalité de Heisenberg-Ozawa. 

L’argument que nous venons de présenter est une version actualisée d’une célèbre 
expérience de pensée, dite du microscope de Heisenberg, destinée à montrer que le 
caractère incompressible et aléatoire de la perturbation apportée par une mesure est 
liée aux fondements de la théorie quantique : quantification des échanges d’éner- 
gie et de quantité de mouvement et caractère aléatoire des évènements quantiques 
individuels. 


15.4 PRINCIPE D'EXCLUSION DE PAULI 
15.4.1 Notion de spin 


Nous avons déjà abordé la notion de spin au chapitre 12 lors de la description de 
l'expérience de Stern et Gerlach. C’est une notion difficile à appréhender puisque 
le spin d’une particule correspond à un moment cinétique intrinsèque (c’est-à-dire 
n'étant pas dû au mouvement de cette particule) qui n’a pas de représentation ou 
d’équivalent classique. 

Toute particule (élémentaire ou composite) possède un moment cinétique de spin, 


a , , A 
que l’on note généralement S . C’est une observable (vectorielle) qui peut donc être 


mesurée. Les valeurs possibles de la projection de ri sur un axe donné sont en 
nombre fini : il y a 2S + 1 valeurs possibles, de —-Sh à +S par sauts d’une unité 
de h. Le nombre S qui caractérise ce spin est nécessairement soit un nombre en- 
ter (S = 0,1,2...), soit un nombre demi-entier (S = 1/2, 3/2, 5/2...). Par exemple, 
les électrons, les protons, les neutrons et les neutrinos ont un spin 1/2, alors que les 
photons ont un spin 1 et que le fameux boson de Higgs a un spin nul. 


15.4.2 Particules indiscernables 


Une des propriétés les plus frappantes du monde quantique est qu’à l’échelle mi- 
croscopique aucune observation ne permet de distinguer deux particules ayant les 
mêmes propriétés physiques (comme la masse, la charge, le spin..). On parle 
d’indiscernabilité. 

Par exemple, tous les électrons sont identiques et impossibles à distinguer par une 
quelconque expérience. On ne peut même pas espérer pister «un » électron particulier 
parmi d’autres en suivant sa trajectoire puisque celle-ci (position et vitesse à tout ins- 
tant) n’est pas définie, conformément aux relations d’indétermination de Heisenberg. 
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15.4. Principe d'exclusion de Pauli 


La description quantique de deux particules 1 et 2 ne se fait pas en considérant 
l’union de deux vecteurs d’état |[ÿ1), [ÿ2), mais avec un seul vecteur d’état |[ÿ) qui 
contient les informations sur les deux particules. Par exemple, dans le cas simple 
où les deux paramètres caractérisant la particule sont sa position sur l’axe Ox et 
la projection mñ de son spin sur l’axe OZ, la quantité Gi, 1,22, donne la 
probabilité de trouver la particule 1 en x, avec une projection m\h et et la particule 2 
en Xx2 avec une projection Mmh. 

S1 les deux particules sont indiscernables, on ne peut pas leur attribuer de numéro, 
et donc cette probabilité est invariante par échange de ces numéros : 


C2, 21, = [G,m,22, ma. (15.23) 


15.4.3 Bosons et fermions 


L’indiscernabilité des particules microscopiques induit une différence majeure entre 
le comportement collectif de particules de spin entier et celui de particules de spin 
demi-entier. 

La relation (15.23) implique que la quantité (x1,M1,x2,mlW) est invariante à un 
coefficient de module un près lors de l’échange des deux particules. On montre que 
ce coefficient est égal à (—1)5+! : 


(0,m0,21, m0) = (D TG, ,22,mal) (15.24) 


c’est-à-dire qu’il vaut 1 pour les particules de spin entier, et —1 pour les particules de 
spin demi-entier. 

Dit autrement, les particules de spin entier, que l’on appelle des bosons, sont 
décrites par un vecteur d’état symétrique sous l’échange de deux particules quel- 
conques, alors que les particules de spin demi-entier, que l’on appelle des fermions, 
sont décrites par un vecteur d’état anti-symétrique sous l’échange de deux particules 
quelconques”. 


15.4.4 Principe d'exclusion de Pauli 


Considérons alors la probabilité de détecter deux fermions au même point x et avec 
la même projection mh. On a : 


(X2 = X,Mm = M,x1 = X,m = MY) = —(x1 = x, = m,x2 = x,mm = mlb) (15.25) 


ce qui implique {x,m,x,mlf) = 0 : on ne peut pas détecter deux fermions au même 
endroit et avec la même valeur de m. Par contre, la démonstration ne s’applique pas 
à deux fermions détectés au même point, mais avec deux valeurs de m différentes. 
Ainsi, deux électrons (spin S = 1/2) dont les projections sont opposées (m = +1/2) 
peuvent se trouver au même point. 


3. Ce résultat porte le nom de fhéorème spin-statistique. 
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On montre plus généralement que /a probabilité que deux fermions soient dans 
le même état quantique est nulle. Ce résultat très important est appelé « principe 
d'exclusion de Pauli » : 


Deux fermions ne peuvent occuper simultanément le même état quantique. 


Il joue un rôle majeur dans la physique des milieux condensés et permet d’expli- 
quer la stabilité de la matière (des plus petits objets, comme les atomes, aux plus gros, 
comme les étoiles à neutrons), la classification périodique des éléments, ainsi que de 
nombreuses propriétés mécaniques, électriques, magnétiques, optiques et chimiques 
des solides. 

Le principe de Pauli n’interdit pas, en revanche, que des bosons occupent simul- 
tanément le même état quantique. On peut, en fait, montrer que les bosons ont ten- 
dance à se regrouper dans le même état. Les photons d’une onde laser, les atomes 
d’hélium-4 superfluides, ou les atomes ultrafroids d’un gaz de Bose-Einstein en sont 
des exemples particulièrement frappants. 

Notons, pour finir, que le principe d’exclusion de Pauli ne fait pas partie, à pro- 
prement parler, des postulats de la mécanique quantique puisqu'il peut être dérivé de 
la généralisation relativiste de celle-ci. Néanmoins, comme nous ne survolerons que 
quelques notions de mécanique quantique relativiste au chapitre suivant, on peut le 
considérer comme faisant partie des principes fondamentaux de la mécanique quan- 
tique non-relativiste. 
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NOTIONS 

DE MÉCANIQUE 
QUANTIQUE 

« ET » RELATIVISTE 





À travers notre exploration du monde quantique, nous ne nous sommes que très ra- 
rement posé la question de la compatibilité de cette théorie avec celle, vue dans la 
première partie de ce livre, de la relativité restreinte. 

Par exemple, lorsque nous avons introduit la notion de longueur d’onde de de 
Broglie, À = h/p, d’une particule, nous n’avons pas précisé si cette expression était 
valable pour la version relativiste, p = ymv, de la quantité de mouvement de cette 


particule (avec y = 1/:/1 — (v/c)°, où v est la vitesse de la particule). Il se trouve 
que c’est bien le cas, et d’ailleurs, Louis de Broglie s’était directement placé dans 
un cadre relativiste pour concevoir l’expression qui porte aujourd’hui son nom. Il 
faudrait donc, en toute rigueur, considérer l’expression suivante pour 38 : 


h 
AB = pe 4/1 — (u/c} (16.1) 


h 


À = 
V2mE. + (E,/c) 


en fonction de l’énergie cinétique relativiste E, = (y — 1) mc? de la particule. 

En revanche, il est aisé de vérifier que l’équation d’évolution de la mécanique 
quantique, c’est-à-dire l’équation de Schrüdinger in2y (x, 0) = hEy (x,t), n’est 
compatible qu'avec la relativité galiléenne, et non avec la relativité d’Einstein. Afin 
de concilier les deux théories, il a donc fallu construire des analogues relativistes de 
cette équation, appelées équations de Klein-Gordon et de Dirac, et valables respecti- 
vement pour les bosons et les fermions. 

Il est bien entendu hors de question d’étudier ici ces équations et leurs solutions, 
qui font appel à des notions et outils mathématiques bien trop avancés par rapport 
au niveau visé par cet ouvrage. Il n’est cependant pas inutile de donner un aperçu 
de quelques-unes de leurs propriétés ou particularités. En particulier, nous verrons 
qu’elles soulèvent le problème fondamental de l’existence de solutions d’énergie né- 
gative (antimatière) et le fait que l’on ne peut pas, en toute rigueur, considérer l’évo- 


ou, de façon équivalente : 


(16.2) 
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lution d’une particule dans l’espace-temps sans prendre en compte l’ensemble des 
particules (réelles ou virtuelles) qui l’environnent. 


16.1 ÉQUATION DE KLEIN-GORDON 


On a vu au chapitre 14 que l’équation (non-relativiste) de Schrôdinger s’obtenait en 
remplaçant, dans la définition de l’énergie classique Æ = p°/2m, les grandeurs E et 
p par les opérateurs in et —ih 2 (principe des opérateurs associés, à une dimension 
d’espace). 
L’équation de Klein-Gordon s’obtient de la même façon mais en considérant la 
définition relativiste de l’énergie E? = p?c? + m°c*. Elle s’écrit : 
dy d  m°c° 
— = ———— y (16.3) 
d (ctŸ (2 h | 


où l’on constate l’apparition naturelle de la longueur d’onde de Compton ACompton = 
h/mc. Cette équation d’onde a, comme l’équation de Schrüdinger, des solutions sous 
forme d’ondes planes (de vecteur d’onde Æ = p/h), mais à chaque impulsion p 
peuvent maintenant correspondre deux énergies opposées : 


E=+pe2+mct ou E =-;,/p?c? + mc (16.4) 


dont un état d’énergie négative qui aura naturellement tendance à être occupé par 
les particules. La conséquence principale est que l’énergie d’un système matériel ne 
serait pas « bornée par le bas » dans le cadre d’une telle théorie, rendant impossible 
la stabilité de tels systèmes. 


16.2 ÉQUATION DE DIRAC, THÉORIE QUANTIQUE 
DES CHAMPS 


L’ambiguïté de signe devant la racine carrée de l’expression précédente de l’énergie, 
ainsi que la dissymétrie apparente entre les rôles des variables x et t, ont conduit Paul 
Dirac à rechercher une équation d’onde avec uniquement des dérivées premières en 
t et en x, mais en prenant comme condition que le carré de cette équation devait 
redonner l’équation de Klein-Gordon, c’est-à-dire redonner l’expression relativiste 
de l’énergie. 

On montre alors qu’une telle équation est nécessairement matricielle, à quatre di- 
mensions, avec des coefficients sous forme de matrices 4x4. Les fonctions d’onde 
solutions ont alors quatre composantes, et sont appelées des spineurs de Dirac. 
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16.3. Incompatibilité de la mécanique quantique et de la relativité générale 


On peut également montrer que la conservation du moment cinétique total, dans 
le cadre de cette équation, implique l’existence de moments cinétiques (spins) demi- 
entiers. Le théorème spin-statistique fournit alors la clef pour relier ces moments ci- 
nétiques d’un genre nouveau avec les deux équations relativistes précédentes : les par- 
ticules élémentaires de spin demi-entier (appelés fermions et constituant la matière) 
obéissent à l’équation de Dirac, alors que les particules élémentaires de spin entier 
(appelés bosons et véhiculant les interactions entre fermions élémentaires) obéissent 
à l’équation de Klein-Gordon, ou à ses généralisations! . 

Aussi belle et puissante soit elle, l’équation de Dirac ne supprime cependant pas 
le problème de la présence d’énergies négatives. mais Dirac en a trouvé la solution 
en postulant que les états d’énergie négative sont en fait tous occupés par des élec- 
trons qui, étant des fermions, ne peuvent pas occuper le même état selon le principe 
de Pauli. Le vide entourant une particule de matière est alors décrit comme une mer 
d'électrons virtuels. Ainsi, dans ce cadre, une particule d’énergie positive peut être 
stable puisqu'elle n’a aucun état d’énergie négative disponible à occuper ! Ce résultat 
signifie cependant que cela n’a plus de sens, en physique quantique relativiste, d’étu- 
dier l’évolution d’une seule particule... Par exemple, arracher au vide quantique un 
de ses électrons laisse, dans la mer d’électrons, un frou, chargé positivement et ayant 
la même masse qu’un électron, qu’on appelle un positron et qui est une particule 
d’antimatière. 

On est donc, en toute rigueur, contraint de considérer l’infinité de ces particules 
(électrons, positrons...) qui « vivent » autour de la particule test que l’on veut étudier. 
D'où le besoin d’une théorie où les électrons et positrons sont en fait les excitations 
élémentaires d’un même champ de matière dans lequel évolue, ou est issue, la par- 
ticule test. Ainsi, comme pour la lumière, champs et particules sont indissociables : 
cette approche des théories quantiques relativistes porte le nom de fhéorie quantique 
des champs et constitue la théorie principale sur laquelle se fonde le modèle standard 
des particules élémentaires (chapitre 9). 


16.3 INCOMPATIBILITÉ DE LA MÉCANIQUE 
QUANTIQUE ET DE LA RELATIVITÉ 
GÉNÉRALE 


S1 la mécanique quantique s’accorde particulièrement bien avec la théorie de la re- 
lativité restreinte, il n’en est pas de même avec la théorie de la relativité générale 
(chapitre 9). Ces deux théories sont en effet incompatibles bien qu’elles semblent, 


1. Il est à noter que toute solution de l’équation de Dirac est solution de l’équation de Klein-Gordon 
(mais l’inverse est faux). 
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chacune de leur côté, donner une description juste et précise de l’univers : vers l’in- 
finiment grand pour la relativité générale, vers l’infiniment petit pour la mécanique 
quantique. 

Parmi les points de divergence, on peut citer par exemple : 


1. Le hasard quantique : la mécanique quantique est une théorie probabiliste alors 
que la relativité est déterministe ; 


2. La structure de l’espace-temps : l’espace-temps de la mécanique quantique est 
fixe et plat alors que celui de la relativité générale est dynamique et sa courbure 
dépend de la répartition de la matière et de l’énergie ; 


3. Le rôle du temps : simple paramètre en mécanique quantique, la variable 
«temps » a le même statut que les variables « position » en relativité ; 


4. Les relations d’Heisenberg : les relations d’indétermination de Heisenberg em- 
pêchant de définir avec certitude les positions et vitesses des particules de ma- 
tière, 11 n’est pas possible de déterminer la valeur du champ gravitationnel en 
un point ; 


5. L'énergie du vide : elle est infinie selon la mécanique quantique, mais nulle 
selon la relativité?. 


Plusieurs théories alternatives ont été proposées au cours des dernières décennies 
pour tenter de concilier les grands principes de ces deux théories discordantes : théo- 
rie des cordes, gravitation quantique à boucles, géométrie non-commutative, relativité 
d'échelle... Mais aucune n’est, pour l’instant, suffisamment complète et consistante. 

Citons, pour finir, un extrait du livre, Rien ne va plus en physique, de Lee Smolin 
paru en 2007 : 


« Deux découvertes expérimentales ont été faites ces dernières décennies : 
d’une part, les neutrinos ont une masse et, d’autre part, l’univers est dominé 
par la mystérieuse matière noire et semble être en expansion accélérée. Mais 
nous n’avons aucune idée de la cause de la masse des neutrinos (ou de toute 
autre particule) et nous ne savons pas expliquer son apparition. Quant à la ma- 
tière noire, elle ne s’explique avec aucune des théories physiques existantes. 
(...) Ces deux découvertes, la relativité et la quantique, nous ont, chacune, de- 
mandé de rompre avec la physique de Newton. Pourtant, malgré ce très grand 
progrès accompli au cours du siècle dernier, ces deux découvertes restent in- 
complètes. Chacune d’elles possède des faiblesses et des défauts, qui tendent 


2. La récente découverte de l’accélération de l’expansion de l’univers a conduit certains chercheurs 
à introduire un nouveau type d’énergie, l’énergie sombre, dont serait issue la force responsable de 
cette accélération et qui, dans les équations de la relativité générale d’Einstein vues au chapitre 9, 
apparaîtrait sous la forme d’une constante cosmologique non-nulle. Estimée à quelques GeV/m*, cette 
énergie sombre est cependant en désaccord total avec les 101?! GeV/m° de l’énergie du vide quantique 
prédite par la théorie quantique des champs. 
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16.3. Incompatibilité de la mécanique quantique et de la relativité générale 


à prouver l’existence d’une théorie plus fondamentale. Mais la raison la plus 
évidente pour laquelle chacune des deux théories est incomplète est l’existence 
de l’autre. Notre esprit nous incite à chercher une troisième théorie, qui unifie- 
rait toute la physique, et la raison à l’origine de cette incitation est simple. II 
est évident que la nature, elle, est « unifiée ». L'univers dans lequel nous nous 
trouvons est interconnecté, dans le sens où tout interagit avec tout le reste. Il ne 
peut y avoir de solution où nous aurions deux théories de la nature, qui décrirait 
des phénomènes différents, comme si l’une n’avait rien à voir avec l’autre. (...) 
Ce problème s’appelle le problème de la « gravitation quantique ». » 


La gravitation quantique reste un mystère. pour la résolution duquel vous, lecteur, 


aurez peut-être un rôle à jouer ! 
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EXERCICES 
ET PROBLÈMES 





Retrouvez les corrigés des exercices et problèmes sur la page dédiée à l'ouvrage sur 
dunod.com. 


@ Course de vitesse « galiléenne » 


Deux nageurs font une course de vitesse sur un fleuve de largeur d. Le premier ef- 
fectue la traversée puis revient à son point de départ. Le second fait un aller-retour le 
long de la rive en parcourant la distance d dans le sens d'écoulement du fleuve, puis 
en revenant à son point de départ. La vitesse des nageurs par rapport à l’eau, notée v, 
est supérieure à celle du courant du fleuve, notée V. 


a) Exprimer le temps que met chacun des nageurs pour effectuer un aller-retour. 
Quel est le vainqueur de la course ? 
Les nageurs sont maintenant remplacés par des photons (les photons sont les 
constituants élémentaires de la lumière, et plus généralement des ondes électro- 
magnétiques, ils n’ont pas de masse et se déplacent à la vitesse c). Le courant du 
fleuve est remplacé par le mouvement de l’éther, cet hypothétique milieu qu’on 
supposait, à la fin du XIXème siècle, occuper tout l’espace, et qui est entraîné 
par la rotation de la Terre, à la vitesse V. 


b) Exprimer le temps que met un signal lumineux pour faire un aller-retour sur une 
distance d, parallèlement et perpendiculairement au mouvement de la Terre, en 
fonction de c, d et V. 


c) Quel est l’écart temporel 6f (le retard) entre ces deux résultats ? (données pour 
l'application numérique : c = 300 000 km/s, d = 10 cm, V = 30 km/s) 
Cette course de vitesse entre photons correspond en fait au parcours de la lu- 
mière dans les deux bras d’un interféromètre de Michelson qui serait entrainé 
par le mouvement de la Terre. Dans un tel interféromètre, le retard 6f se maté- 
rialise par un « déphasage » 69 = wôt entre les figures d’interférences, v = w/27r 
étant la fréquence de l’onde lumineuse utilisée. 


d) Exprimer 64 en fonction de 1, c et ôt. On rappelle que 1 est la longueur d’onde 
de l’onde lumineuse : À = c/v. Faire l’application numérique pour 1 = 0,5 um. 


Une demi-vie bien relative 


On considère une particule susceptible de se désintégrer, dont le temps de demi-vie 
est T. 


a) Rappeler la définition de 7 et dans quel référentiel cette définition est valable. 


255 


Copyright © 2015 Dunod. 


Introduction à la physique moderne 


b) 


c) 


d) 


On suppose maintenant que cette particule est en mouvement de vitesse 
constante Ÿ par rapport à un observateur ©. L'énergie de cette particule, vue 
depuis le référentiel de l’observateur, est E. Exprimer la vitesse de la particule 
en fonction de E, de la masse m de la particule et de c. 


Quel est le temps de demi-vie de la particule vue dans le référentiel de l’obser- 
vateur ? On l’exprimera en fonction de E et m. 


Que peut-on dire de ce temps si la masse de la particule tend vers zéro ? Com- 
menter sur la stabilité des particules de faible masse, et en particulier des pho- 
tons. 


Où l’on parle d’un œuf dans une bouteille... 


Soit R’ un référentiel galiléen animé d’une vitesse V = 0,6c par rapport à un autre 
référentiel galiléen R. La vitesse V est parallèle aux axes (Ox) et (Ox’), et les hor- 
loges des deux référentiels sont ajustées de telle sorte que les trois axes, ainsi que les 
origines © et O’, de ces référentiels coïncident à l’instant 1 = 0 = f”’. On rappelle que 
l’unité « année-lumière » correspond à la distance parcourue par la lumière pendant 
une année Terrestre. 
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a) 


b) 


c) 


d) 


€) 


8) 


h) 


Donner l’expression du facteur de Lorentz y en fonction de V et c, puis faire 
l'application numérique. 


Donner l’expression littérale des transformations de Lorentz permettant de pas- 
ser des coordonnées du référentiel À à celles du référentiel À’, et inversement. 


Soit M, l’évènement de coordonnées x, = 4,6 années-lumière et f, = 1 an dans 
R. Quelles sont ses coordonnées (x 4) dans R’ ? (Donner l’expression littérale, 
puis faire l’application numérique) 


Soit M) l’évènement de coordonnées x = 3,2 années-lumière et # = 2 ans 
dans R. Quelles sont ses coordonnées (2%) dans À’ ? (Donner l’expression 
littérale, puis faire l’application numérique) 


On définit les longueurs Ax’ et Ax par les relations : Ax” = x,—x et Ax = x2-x1. 
Comparer Ax’ à Ax? Est-ce un exemple de contraction relativiste des lon- 


gueurs ? (Justifier clairement) 


Soit un objet, immobile dans R’, de longueur propre égale à Lo. Quelle est la 
longueur de cet objet mesurée dans À ? (Donner l’expression littérale, puis faire 
l'application numérique avec la valeur de Lo = Ax’ déterminée précédemment) 


Reprendre la question précédente dans le cas où le référentiel R’ se déplace 
dans le sens opposé : V = —0,6c. Conclusion ? 


Donner un ordre de grandeur de la vitesse à laquelle un œuf (de poule) devrait 
se déplacer pour pouvoir rentrer, par effet de contraction relativiste, à travers 
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le goulot d’une bouteille (de champagne, par exemple). À vous de définir la 
géométrie du problème et d’estimer les dimensions transverses de l’œuf et du 
goulot ! Commenter. 


Hors-jeu relativiste 


Au football, un joueur A1 est dit hors-jeu quand un coéquipier A2 lui passe le ballon 
alors qu’il se situe entre le dernier défenseur D et le gardien de but G de l’équipe 
adverse. 


A2 D : A G 
Lu Ô Le 


Figure 1- Situation de hors-jeu pour A1, vu de &. 


Le but de cet exercice est d’étudier cette règle du football... avec une description 
relativiste ! 

Les joueurs A2 et G sont immobiles par rapport au référentiel attaché au terrain que 
l’on notera À. AI court (très vite !) en direction de G selon l’axe Ox avec une vitesse 
V par rapport à R. On notera À’ le référentiel propre de A1. Le défenseur D court 
(aussi très vite !) vers A2, selon Ox avec une vitesse —V par rapport à À (en vue d’in- 
tercepter le ballon, mais ça c’est un autre problème !). Le référentiel propre de D est 


noté R’’. 
Initialement, les horloges des trois référentiels indiquent le même temps 1 = # = 1” = 
0, et leurs origines O, O’ et O”” ainsi que leurs axes (Ox), (O0” x’) et (0””’ x”) coïncident. 


Dans le référentiel À, A2 est en x = —Ly et G se trouve en x = LG. On choisit l’ori- 
gine des temps telle qu’à : = 0 les joueurs Al et D se croisent en x = 0. C’est à cet 
instant précis, dans À, que le joueur A2 frappe le ballon pour l’envoyer au joueur Al. 


On définit donc les deux événements suivants : Æ2 : « A2 frappe la balle », et E; : 
« Al entre en position de hors-jeu (au croisement avec D) ». 


V -V 
2 :  _— 
A2 A1 : D G 
Le : Le * 


Figure 2- Situation avant la passe quand t < 0, vu de R. 
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a) 


b) 


C) 


d) 


f) 


8) 
h) 
i) 
j) 
k) 


m) 


Donner les transformations de Lorentz qui permettent de passer des coordon- 
nées (x,ct) d’un événement dans le référentiel R à celles (x’,cf’) de ce même 
événement dans le référentiel R’ ; ainsi que celles qui permettent de passer des 
coordonnées (x,ct) dans R aux coordonnées (x’”,cf’”) dans R”. Préciser égale- 
ment l’expression du facteur y associé. 


1. Quel est l’instant de croisement f, de Al et D dans À’ ? 
2. De même, à quel instant f/” se croisent ces joueurs dans R’” ? 


À quel point d’espace-temps (Ct», xp) de R se trouve A2 quand il effectue la 
passe ? 

À quel point d’espace-temps (cr, x,) de R’ se trouve A2 quand il effectue la 
passe ? 

Donner l’expression, en fonction de V, de la vitesse relative V; de AT par rap- 
port à D (égale à la vitesse de À’ par rapport à R’’). 

À quel point d’espace-temps (cr, x,) de R’” se trouve A2 quand il effectue la 
passe ? 


En utilisant la question 5), exprimer x, en fonction de x, et cf,,. 


/ 


En comparant les temps f et f,, 


dans R’. 
Même question dans À” en comparant les temps f et f,. 


dire si Al se trouve en situation de hors-jeu 


Conclure sur cette règle du hors-jeu dans le cas relativiste. 


1. Qu'est-ce qu’un intervalle espace-temps entre deux événements ? Que 
pouvez-vous dire sur la valeur qu’il prend dans différents référentiels gali- 
léens ? 

2. Donner l’expression de l’intervalle d’espace-temps As? entre E> et E1. De 
quel genre est-il ? 

3. En supposant que vous ne connaissiez que le genre de l’intervalle trouvé 
en 2., auriez-vous pu en déduire la présence ou non d’un lien de causalité 
entre les deux événements ? Justifier votre réponse. 


1. Donner l’ordre chronologique dans lequel le gardien G voit les deux évé- 
nements ÆE) et E; (c’est-à-dire l’ordre dans lequel l’œil du gardien perçoit 
les rayons lumineux émis lors de ces événements). Justifier votre réponse. 

2. Le gardien peut-il, à partir de ce qu’il perçoit, conclure à un lien de causa- 
lité entre les deux événements ? Justifier qualitativement votre réponse. 

1. On suppose, dans cet exercice, que le ballon est également un objet rela- 
tiviste. Sa vitesse selon x est V; = 0.8c et selon y, V,  c. Vu depuis le 
référentiel À du terrain, quelle est la forme du ballon ? En sachant que le 
rayon propre de ce ballon est R, = 11 cm calculer sa dimension R, dans R. 
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2. Dans certains dessins animés mettant en scène une partie de football, pour 
montrer sa grande vitesse le ballon a une forme ovale, aplatie selon l’axe 
Oy (Rx > R,), qu’en pensez-vous ? 


O N'est pas gagnant celui qu’on croit! 


Deux vaisseaux spatiaux décident de faire une course. Ils partent dans des directions 
opposées, à la même vitesse vo = +0,8c par rapport au référentiel R associé à la ligne 
de départ. On choisit la direction de la course comme axe (Ox) de ce référentiel, et 
la ligne de départ comme origine des coordonnées, où se tient, immobile, le juge de 
course. La ligne d’arrivée du vaisseau 1 se situe en x; = 0,8 années-lumière, celle du 
vaisseau 2 en x = —0,8 années-lumière. 


a) Quel est le résultat de la course selon le juge de course ? Justifier. 


b) Soient E; et E) les évènements associés à la fin de la course : E; correspon- 
dant au vaisseau 1 coupant sa ligne d’arrivée, et E, correspondant au vaisseau 
2 coupant sa ligne d’arrivée. Déterminer As?, le carré de l’intervalle d’espace- 
temps entre ces deux évènements. Donner l’expression littérale dans À, puis 
faire l’application numérique. 


c) De quel type d’intervalle s’agit-1l ? Existe-t-il un référentiel où ces deux évène- 
ments seraient distants de moins de 1,6 années-lumière ? Justifier. 


d) On cherche maintenant à comprendre quel est le résultat de la course mais vu 
depuis chacun des vaisseaux. 


1. Soit À’ le référentiel propre associé au vaisseau 1 (les horloges des deux 
référentiels R et R’ sont ajustées de telle sorte que les origines O et O’ 
des référentiels coïncident à l’instant £ = f’ = 0 du début de la course). 
Déterminer les coordonnées temporelles 4 et LA des évènements E; et E> 
dans À. 


2. Choisir, en expliquant clairement la raison de votre choix, une des solutions 
ci-dessous : 


I. Chaque vaisseau pense avoir gagné. 

IT. Chaque vaisseau pense avoir perdu. 
III. Le vaisseau 1 pense avoir gagné et le vaisseau 2 pense avoir perdu. 
IV. Le vaisseau 2 pense avoir gagné et le vaisseau 1 pense avoir perdu. 


V. Aucune de ces réponses. 


Q Une autre course de vaisseaux 


Deux vaisseaux, de vitesses respectives v, et v: non négligeables devant celle de la 
lumière, décident de faire la course pour arriver jusqu’à la Terre. Le vaisseau 2 est 
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deux fois plus rapide que le vaisseau 1 (v2 = 2v,), mais, il doit parcourir une dis- 
tance L; deux fois plus importante que L;, celle que doit parcourir le vaisseau 1, soit 
L; = 2L1. Les distances L; et L, sont mesurées dans un référentiel fixe par rapport à 
la Terre (référentiel À). 


a) 


b) 


C) 


d) 
e) 


2) 


h) 


Vu de la Terre (référentiel R), exprimer les temps f1 et f mis par les vaisseaux 1 
et 2 pour arriver sur Terre en fonction de Z; et vi. Quel est le résultat de la 
course selon un arbitre immobile sur Terre ? 


Au courant de ce résultat prévisible, le pilote du vaisseau 1 a proposé d’embar- 
quer l’arbitre de façon à ce que l’horloge du vaisseau 1 décide du vainqueur de 
la course. Avant d’accepter, le pilote du deuxième vaisseau souhaite vérifier que 
cela ne tourne pas à son désavantage. 


s 


Soit R’ le référentiel lié au vaisseau 1. Donner dans R’ les distances L' et L', à 
parcourir par chacun des vaisseaux en fonction de c, L; et de v1. 


À quelles vitesses se déplacent la Terre et le vaisseau 1 dans R’ ? En déduire le 
temps f, mis par le vaisseau 1 pour arriver sur Terre dans R”. 
Exprimer en fonction de c, v et v la vitesse du vaisseau 2 dans À’. 
Déterminer f,, le temps mis par le vaisseau 2 pour arriver sur Terre dans R”. 
Démontrer alors que : 

t À 


ts 
1 





Quelles valeurs extrêmes peut prendre v, si on veut que les données du problème 
f, 

restent correctes ? Donner alors un encadrement de +. 
| 

S'il veut gagner, le pilote du vaisseau 2 doit-il accepter que les temps d’arrivée 


soient déterminés dans le vaisseau 1 (R’) ? 


On considère les deux événements arrive du vaisseau 1 et arrive du vaisseau 2. 
Donner en justifiant le signe de l’intervalle spatio-temporel As? entre ces deux 
événements. De quel type d'intervalle s’agit-1l ? 


Croisement de fusées 


Une fusée part de la Terre à l’instant : = 0 avec une vitesse constante uv, = Bic, 


B1 = 


4/5, vers l’étoile la plus proche du Soleil, Proxima du Centaure, située à 


quatre années lumière de nous. La distance entre la Terre et cette étoile sera supposée 
constante par la suite. 


Les référentiels R et R’ sont, respectivement, liés à la Terre et à la fusée. Les axes 
de coordonnées sont parallèles et les origines sont confondues à l’instant ? = 0. 
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L’axe (Ox) sera pris dans le sens du mouvement de la fusée. Les résultats des ap- 
plications numériques s’exprimeront en années et années lumières. 


a) Calculer la durée du voyage pour un observateur Terrestre. 


b) En déduire la durée du voyage pour un observateur à bord de la fusée. 


Simultanément (dans R) au départ de la première fusée, une deuxième fusée 
part de Proxima du Centaure vers la Terre, en mouvement rectiligne uniforme, 
à une vitesse v2 = HB2c, B2 = 1/2. Appelons À et B les événements correspondant 
aux deux départs. 

XA = O,fa = 0,xp = d,tp = 0, d = 4 années lumière. 


c) Exprimer les coordonnées “à t Xpstp de ces deux événements dans À’ en fonc- 
tion de c, d et d’un des deux paramètres B, ou B3. Effectuer les applications 
numériques. 


d) Est-ce que les deux départs de fusées sont simultanés dans R’ ? Justifier votre 
réponse. 


e) Trouver, dans À, la position x” et le temps f” correspondant au croisement des 
deux fusées. 


Faire l’application numérique. Ce calcul est-il relativiste ou non-relativiste ? 
Justifier votre réponse. 


E Train et tunnel relativistes - ou - le paradoxe de la bombe 


On considère un train « très » rapide traversant un tunnel rectiligne dont la longueur 
propre Lo est identique à la longueur propre du train. La vitesse (constante et uni- 
forme) V du train par rapport au tunnel est supposée proche de celle de la lumière c. 


Conformément à la théorie de la relativité restreinte, la longueur L du train apparaîtra 
donc plus courte si elle est mesurée dans le référentiel RÀ du tunnel. Réciproquement, 
c’est le tunnel qui apparaîtra plus court si sa longueur est mesurée dans le référen- 
tiel R’ du train (phénomène de contraction des longueurs). 


On appelle À et B les extrémités avant et arrière du train, et G et H les points d’entrée 
et de sortie du tunnel. Avant que le train ne pénètre dans le tunnel, ces quatre points 
se lisent donc B — À — G — H de la gauche vers la droite (faire un schéma !). 


On choisit B, l’arrière du train, comme origine de coordonnées spatiales du référen- 
tiel À’, et G, l’entrée du tunnel, comme origine de coordonnées spatiales du référen- 
tiel R. Les coordonnées spatiales des extrémités À et B du train dans le référentiel R’ 
sont donc : 
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L'origine temporelle commune des deux référentiels correspond à l’instant où B et G 
coïncident. Ainsi, l'événement : 


E; = «l'arrière B du train coïncide avec l’entrée G du tunnel » 


a pour coordonnées (x1 = 0,1 = 0) dans R et (x = 0,f, = 0) dans À’. 


On cherche, dans un premier temps, à déterminer les coordonnées de l’événement : 
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a) 


b) 


c) 


d) 


e) 


ES 


E3 = «/l’avant À du train coïncide avec la sortie H du tunnel » 


. Donner l’expression de L en fonction de Z, et y, puis celle du facteur de 


Lorentz y en fonction de V et c. 


Rappeler les formules de Lorentz exprimant les coordonnées (x,f) d’un 
événement dans À en fonction des coordonnées (x’,r”) de ce même événe- 
ment dans À’. 


. Quelle est la trajectoire xg (r) de l’extrémité B du train dans R ? 


Exprimer les coordonnées spatio-temporelles de l’extrémité À du train 
dans R (en utilisant les transformations de Lorentz). 


. Éliminer la variable « r » des deux équations obtenues à la question b.2. 


pour déterminer la trajectoire x1 (r) de l’extrémité À du train dans À. 


Donner l’expression de x4 (f) — xg (f) en fonction de Lo et y, puis comparer 
à la question a.1. 


Déterminer les coordonnées (x,h) de l’événement E> dans À. 

Quelle durée At sépare les deux événements E; et E; dans R ? 

Dans le référentiel À, lequel des deux événements a lieu avant l’autre ? 
Déterminer les coordonnées (x,,4) de l’événement E) dans R’. 


Quelle durée sépare les deux événements E; et E dans R’ ? Comparer au 
résultat de la question c.2. 


Dans le référentiel À’, lequel des deux événements a lieu avant l’autre ? 
Y-a-t-1l un paradoxe au vu de la question c.3 ? 


. Donner l’expression de l’intervalle d’espace-temps As? entre les deux évé- 


nements E; et E>. 


De quel signe est-il ? Comment appelle-t-on ce type d’intervalle d’espace- 
temps ? 


. Est-ce que les deux événements £; et E, peuvent être reliés par un rayon 


lumineux dans un référentiel ? Justifier. 
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f) Un signal lumineux (isotrope) est émis à l’arrière du train lorsqu’advient l’évé- 
nement £,. Dans À, ce signal atteint l’avant À du train à l’instant #3. 


g) 1. De quel signe est la quantité #3 — #2 ? 
2. Calculer #3 — #2. 
3. On présente parfois cet exercice sous la forme : 
« Une bombe, située à l’avant du train, est réglée pour exploser à l'instant précis où 
l’avant du train sort du tunnel. Cette bombe peut néanmoins être désamorcée par un 


signal lumineux émis à l'arrière du train à l'instant précis où l'arrière du train entre 
dans le tunnel. » 


À votre avis, la bombe explosera-t-elle ? Justifier. 


O Miroir, mon beau miroir... 


Deux princesses (relativistes !) À et B courent toutes les deux, côte à côte, selon la 
même direction et dans le même sens, à la vitesse V = 0,999998c par rapport au sol 
Terrestre. La princesse A tient à bout de bras un miroir leur faisant face. 


a) Que voit la princesse B dans le miroir ? Justifier clairement votre/vos choix ! 


1. Rien. 
2. Elle-même, mais courant au ralenti. 


3. Elle-même, mais avec des couleurs différentes (décalées vers le bleu par 
exemple). 
4, Elle-même, mais contractée dans la direction du mouvement. 


5. Aucune de ces réponses. 


b) Écrire V/c sous la forme 1-«, et en déduire une expression approchée du facteur 
de Lorentz y en fonction de «. Faire ensuite l’application numérique. 


c) Estimer un ordre de grandeur de « l’épaisseur » des deux princesses vue de- 
puis le référentiel lié au sol Terrestre. (« épaisseur », ici, signifie « largeur, ou 
extension, selon la direction du mouvement ») 


ED Flash rouge ou flash bleu ? 


Un véhicule muni d’une horloge quitte l’origine x = 0 du référentiel R à l’instant 


t = 0 avec une vitesse v = +86 dirigée le long de l’axe (Ox). Quand l'horloge du 


véhicule indique le temps To, le véhicule envoie un flash lumineux rouge, de longueur 
d’onde 0,8 um, vers l’origine de À. On appellera R’ le référentiel lié au véhicule. 


a) Donner la valeur numérique du facteur de Lorentz y associé au mouvement 
relatif des référentiels R et R’. 
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b) Rappeler les formules de passage des coordonnées spatio-temporelles d’un évé- 
nement dans À en fonction de celles du même événement dans R’. Donner éga- 
lement les fomules de passage inverse. 


c) Soit l’événement : « émission du flash lumineux rouge par le véhicule », déter- 
miner ses coordonnées (cr 4) dans À’, puis ses coordonnées (cf1,x1) dans À. 


d) Quelle est la trajectoire, dans R, du flash lumineux rouge ? 


e) Soit l'événement : « réception du flash lumineux rouge par l’origine de R», 
déterminer ses coordonnées (cf,x2) dans R, puis ses coordonnées (cr,,x,) 
dans À’. 


f) Quand l’horloge du référentiel R indique le temps 70, un flash lumineux bleu, 
de longueur d’onde 0,4 ym, est émis par l’origine © de R en direction de l’ori- 
gine O’ de R’. Déterminer, dans À, l’instant 73 de croisement des flashs lumi- 
neux rouge et bleu. 


g) Est-ce que le flash bleu détecté par le véhicule est dans le domaine visible (c’est- 
à-dire entre 0,4 yum et 0,8 um) ? Justifier. 


OD Plus vite que la lumière ? 


s 


On considère trois référentiels liés à trois observateurs se déplaçant le long de 
l’axe (Ox) : un observateur O, un observateur S allant vers la droite de O en mouve- 
ment rectiligne uniforme à la vitesse v = 0,8c par rapport à O, et un observateur S” 
allant vers la gauche de O en mouvement rectiligne uniforme à la même vitesse v par 
rapport à O. Ces trois référentiels coïncident à l’instant f = 0. 


a) L’observateur © dit : « La distance entre S et S’ étant 4 = 1,6ct (en fonction du 
temps propre ft de l’observateur O), elle augmente dans le temps à une vitesse 
supérieure à c, ce qui contredit les principes de la relativité restreinte. » Est-ce 
que cette conclusion est correcte ? Expliquer pourquoi. 


b) Rappeler la formule relativiste d’addition des vitesses en précisant la signifi- 
cation des différents termes, et donner l’expression de u, la vitesse de S’ par 
rapport à S, en fonction de v. Faire l’application numérique. 


Absorption-émission de photons, effet Môssbauer 


Les noyaux atomiques peuvent absorber, émettre ou diffuser des photons. 


Absorption. Considérons donc un noyau de masse au repos m0 qui absorbe un pho- 
ton incident d’énergie Q. L'état final du système est alors constitué d’un noyau excité 
de masse au repos m”’ # mo et de vitesse v (appelée vitesse de recul). 


a) Faire un schéma pour représenter l’état du système avant et après l’absorption, 
et écrire les relations de conservation de l’énergie et de l’impulsion relativistes. 
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Exprimer ensuite m’ et v en fonction de m0 et Q. 

En fait, les lois de la mécanique quantique prédisent qu’il n’existe qu’une liste 
discrète des valeurs possibles de m’. Si m’ n’appartient pas à cette liste « quan- 
tique », que devient le photon après son interaction avec le noyau ? 


Emission. Considérons maintenant le processus inverse : l’émission d’un photon 

d'énergie © par un noyau excité de masse au repos m0. Après l’émission, la masse au 
FRE / . à L — 

repos du noyau s’écrira m°, son énergie E” et son impulsion p’. 


d) 


e) 
n 


8) 


Suivre la même démarche que dans le cas de l’absorption : schéma et relations 
de conservation. 
Que représente physiquement la quantité AE = moc? — mc? ? 


0 
Utiliser la relation fondamentale E’? ="p'?c? + rc” pour exprimer Q en fonc- 


tion de mo et AE. 


La question précédente a mis en lumière le fait que l’énergie d’un photon est 
diminuée par effet de recul. Même si cet effet est faible (comme vous pouvez 
le vérifier facilement), il ne peut pas être négligé dans les calculs de mécanique 
quantique. Cependant, lorsque le noyau concerné fait partie d’un assemblage 
régulier de noyaux comme dans un cristal, on peut observer des photons émis 
(ou absorbés) avec l’énergie AE, c’est-à-dire sans effet de recul (c’est l’effet 
Môssbauer). Comment expliquer simplement cet effet ? 


Création de Pion par collisions proton-proton 


Dans les accélérateurs-collisionneurs de particules, on peut convertir de l’énergie ci- 
nétique en masse et produire ainsi de nouvelles particules. Considérons par exemple 
une collision proton-proton qui, dans certaines conditions, peut créer une particule 
appelée Pion, responsable de la force nucléaire forte : 


p+p— p+n+x 


Plaçons-nous d’abord dans le référentiel du centre de masse, le proton « de gauche » 
allant vers la droite et le proton « de droite » allant vers la gauche, tous deux à la 
vitesse . Après la collision, les particules sont supposées au repos. Les masses im- 


a) 


b) 


pliquées sont mr/m, © 0,149 etm, & m, © 938 MeV/c°. 


En utilisant la relation de conservation de l’énergie, exprimer et calculer le rap- 
port u/c nécessaire à la création d’un Pion. 

Calculer également l’énergie cinétique relativiste des deux protons avant la col- 
lision. 

Considérons maintenant une collision proton-proton où un des protons est im- 
mobile. Pour éviter de faire de nouveaux calculs, reprenons le cas précédent 
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mais plaçons-nous dans un référentiel allant vers la gauche à la vitesse u tel que 
le proton de droite soit immobile. 


c) Exprimer la vitesse v du proton de gauche en fonction de u et c. 
d) Exprimer et calculer l’énergie cinétique relativiste de ce proton mobile. 


e) Comparer cette énergie à celle obtenue à la question b) (lorsque les deux protons 
étaient mobiles). Pourquoi est-elle plus importante ? Conclusion. 


Œ2 Énergie minimale de création d’un boson de Higgs 


On ne considèrera, dans cet exercice, qu’une seule direction spatiale, et l’on notera 
«c » la vitesse de la lumière. 


a) Généralités 
1. Rappeler l’expression relativiste qui lie l’énergie E et la quantité de mou- 
vement p d’une particule de masse m. 
2. Exprimer également E en fonction du facteur de Lorentz y, de m et de c. 


3. Rappeler l’expression de y en fonction de c et de la vitesse v de la particule, 
puis exprimer le rapport v/c en fonction de y. 


4, En déduire l’expression de v/c au premier ordre en 1/y? dans le cas ultra- 
relativiste (y > 1). 


b) On considère, dans le référentiel du laboratoire, la collision frontale entre deux 
électrons de même vitesse absolue vo. 


1. Déterminer l’énergie minimale Eo, de chaque électron, nécessaire à la créa- 
tion d’un boson de Higgs (Myiggs = 125 GeV/c?) lors de l’annihilation des 
deux électrons suite à leur collision. 


2. Déterminer la valeur numérique du facteur de Lorentz yo associé à vo (rap- 
pel ! Mélectron = 0,5 MeV/c?). 


3. En déduire la valeur numérique de 1 — vo/c. 


c) On suppose maintenant que l’un des deux électrons précédents est au repos dans 
le référentiel du laboratoire, et que l’autre vient le percuter à la vitesse v1. 


1. Déterminer l’énergie minimale Æ;, de l’électron mobile, nécessaire à la 
création d’un boson de Higgs. 


2. Déterminer la valeur numérique du facteur de Lorentz associé y1. 
3. En déduire la valeur numérique de 1 — vi/c. 
4. Comparer ce résultat avec celui de la question b.3. 
d) On se place dans le cas ultra-relativiste (y > 1). Donner l’expression approchée 


« : « . pc 
de E en fonction de p et c, puis exprimer y en fonction du rapport +. 
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Empoisonnement d’un agent secret au Polonium 210 


En novembre 2006, à Londres, un ancien agent des services secrets est mort empoi- 
sonné par ingestion de Polonium ?!°Po. On se propose, dans ce problème, d’étudier 
les réactions nucléaires mises en jeu et d’évaluer la dose de radiations absorbées qui 
a conduit à la mort de cet homme. 


a) Le ?!0Po peut être obtenu à partir du Bismuth Di après absorption (provo- 


quée) d’un neutron (= réaction 1), puis émission d’un électron (= réaction 2). 
Ecrire et préciser le nom de ces deux réactions, et donner le nombre de protons 
d’un noyau de ?!°Po. 


b) Calculer le défaut de masse (en ) de chacun des deux isotopes du Bismuth 
apparaissant dans les réactions précédentes. 


On donne : m, = 1,007276u, m, = 1,008665u, m(?Bi) = 208,934860u, 
m (210Bi) = 209,938584u. 


c) Sachant qu’un noyau atomique est d’autant plus stable que son énergie de liai- 
son « par nucléon » est élevée, lequel de ces deux isotopes est le plus stable ? 


d) Un noyau de ?!°Po n’est pas stable et se désintègre spontanément en émettant 
une particule alpha pour donner un noyau de plomb. 


1. Écrire la réaction de désintégration correspondante et calculer l’éner- 
gie cinétique maximale de la particule alpha émise (rappel : 1u * €? = 
931,5MeV). 


2. Est-ce un «rayonnement ionisant » très énergétique ? (comparé, par 
exemple, aux quelques eV typiques d’un photon du domaine visible). On 
donne : m(21°Po) = 209,936800u, m(*He) = 4,001506u, m(?95Pb) = 
205,929489u. 


e) La quantité de ?!° Po ingérée par l’agent secret a été estimée à 10 ug par les auto- 
rités britanniques. Calculer le nombre No d’atomes de ?!°Po absorbés (rappel : 
lu = 1,66054.1072? kg). 


f) Préciser la relation donnant l’activité A, de ces M, atomes de Polonium en fonc- 
tion de M, et de la période radioactive du Polonium ?!°Po. 


1. Calculer numériquement l’activité A9 sachant que la période radioactive du 
210 po est de 138,38 jours. 


2. Combien de particules alpha — dues aux 10 ug de ?!°Po radioactif — sont 
alors émises par seconde ? 


3. Expliquer pourquoi l’enquête policière a été facilitée par la valeur impor- 
tante de la période radioactive du Polonium 210. 
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g) On rappelle que la « dose » radioactive est définie comme étant l’énergie dépo- 
sée (par les rayonnements ionisants) dans une unité de masse de matière (unité : 
le Gray, 1 Gy = 1 J/kg). 

1. Quelle était la dose journalière (en Gray) reçue par l’agent secret 
(m = 75 kg) au début de son empoisonnement ? (on supposera l’activité 
constante) 

2. Pour obtenir la « dose équivalente » correspondante (en Sievert S v), 1l faut 
multiplier le résultat précédent par 20 (facteur 20 pour particules alpha). 
Sachant que la dose (équivalente) létale est de 10 Sv, conclure sur la cause 
du décès de l’agent secret. 


A Datation au carbone 14 
Un isotope du carbone, le l#C, est formé dans les plus hautes couches de l’atmosphère 
par l’impact d’un neutron n sur un noyau d’azote, suivant la réaction : 
EN +n —{* C+x 

On donne les valeurs suivantes : masses au repos pour le proton p, le neutron n, et 
pour les noyaux de NW et de C : mn) = 1,009u; m(p) = 1,007u; m(4N) 
14,003u ; m(l*C) = 14,007u, avec lu = 1,6.10727 kg. Charge élémentaire e 
1,610 0 

a) Déterminer les numéros Z et À de la particule x. De quelle particule s’agit-1l ? 

b) Calculer les défauts de masse Am de l#N et de l#C. 


c) Exprimer alors l’énergie de liaison par nucléon que possèdent les noyaux l*N 
et l#C en fonction de c. Lequel des deux noyaux est le plus stable ? 


d) Exprimer l’énergie de la réaction AE en fonction de m(l#N), m(*C), m(n), m(p) 
et c. La réaction est-elle endothermique ou exothermique ? Faire l’application 
numérique en eV. 


e) On suppose que l’azote est initialement au repos. Déterminer l’énergie cinétique 
minimale que doit avoir le neutron pour que la réaction puisse avoir lieu. 


f) Dans ce cas, en déduire l’expression et l’ordre de grandeur de + sa vitesse par 
rapport à celle de la lumière. 


Effet photoélectrique sur les satellites 


Un satellite en orbite peut se charger par effet photoélectrique quand la lumière du 
Soleil éjecte des électrons de sa surface. Les ingénieurs doivent donc concevoir les 
satellites de façon à ce que cet effet soit réduit au minimum. Supposez qu’un satellite 
est couvert de platine, métal ayant un travail d’extraction très élevé (5,32 eV). Trou- 
vez la plus grande longueur d’onde de lumière solaire incidente pouvant éjecter un 
électron du platine. 
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Exercices et problèmes 


M Force électromagnétique exercée sur un miroir 


a) Rappeler l’expression de l’énergie et de la quantité de mouvement d’un des 
photons associés à une onde électromagnétique plane de champ électrique 
« Egexp{oi#) ,, 


b) Ces photons sont incidents sur un miroir parfaitement réfléchissant se trouvant 
dans le plan xOy (c’est-à-dire orthogonal à la direction (Oz)). Déterminer la 
direction et l’amplitude de la quantité de mouvement acquise par le miroir lors- 
qu’un photon se réfléchit sur sa surface. 


c) Exprimer la force exercée sur le miroir par un faisceau lumineux dont le flux de 
photons est de N photons par seconde. 


d) En déduire la force exercée sur le miroir par un faisceau lumineux de puissance 
P=3mw. 


D) Pression de radiation solaire sur la Terre 

L’intensité 7 du rayonnement solaire au niveau de la Terre est 7 = 1,35 kKW.m 2. 
Données supplémentaires : distance Terre-Soleil D = 1,5.10!! m, rayon Terrestre 
R = 6,4.106 m, masse du Soleil ms = 2.1030 kg, masse de la Terre mr = 6. 1024 kg, 


constante de gravitation G = 6,67.107!! N.m°.kg ?, vitesse de la lumière dans le 
vide c = 3.10$ m.s”!. 


a) Exprimer la puissance totale P émise par le Soleil en fonction de Z et D. Faire 
l'application numérique. 


b) Soit , le flux (en 57!) de photons solaires de fréquence y reçus par la Terre. Ex- 
primer la puissance P, associée à ces photons tombant sur la Terre (en fonction 
de ,, h et v). Faire l’application numérique. 


c) Exprimer la norme de la quantité de mouvement portée par un photon de fré- 
quence y en fonction de h, v et c. Faire l’application numérique. 


d) Exprimer la norme de la force (dite « de pression de radiation ») F, qu’exercent 
les photons solaires de fréquence v sur la Terre (en fonction de #,, h, v et c). 
Faire l’application numérique. 


e) Exprimer la norme de la force totale F qu’exerce l’ensemble des photons so- 
laires sur la Terre (en fonction de 7, R et c). Faire l’application numérique. 


f) Comparer cette force à la force d’attraction gravitationnelle entre le Soleil et la 
Terre. 
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Un, deux, trois, quatre... polariseurs 


Des photons polarisés verticalement traversent un polariseur dont l’axe passant fait 
un angle orienté de +60° avec l’axe horizontal. On notera |H) et [V) les états de pola- 
risation horizontal et vertical. 
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a) 
b) 


c) 


d) 


€) 


8) 


h) 


i) 


j) 


Faire un rapide schéma (à 2D) représentant la polarisation du photon, l’axe ho- 
rizontal et l’axe passant du polariseur. 


Quelle est la probabilité qu’un photon soit transmis par le polariseur ? (faire 
l’application numérique) 


Exprimer l’état de polarisation [f,) d’un photon transmis en fonction de |H) et 
IV). 

On place maintenant un deuxième polariseur (après le premier) sur le trajet des 
photons. L’axe passant de ce polariseur fait un angle orienté de —30° par rapport 
à l’axe passant du premier polariseur. 


Quelle est la probabilité qu’un photon soit transmis à travers les deux polari- 
seurs ? Faire l’application numérique. 

On ajoute un troisième polariseur (après les deux autres). 

Déterminer l’angle orienté 4 de son axe passant (par rapport à l’axe horizontal) 
pour qu'aucun photon ne soit transmis à travers l’ensemble des trois polariseurs. 
On suppose maintenant que l’angle 8 de ce troisième polariseur varie dans le 
temps de façon uniforme : 0 (f) = wt, où la pulsation w est constante. Exprimer 
la probabilité P6 (ft) qu’un photon soit transmis à travers l’ensemble des trois 
polariseurs. 

On ajoute un quatrième polariseur (après les trois autres) dont l’axe passant fait 
un angle orienté w(t) = wt + n/2. Exprimer la probabilité P; (f) qu’un photon 
soit transmis à travers l’ensemble des quatre polariseurs. 

Déterminer les instants f, pour lesquels la probabilité P} (f) est maximale (en 
fonction de w et d’un nombre entier n). 

Reprendre les cinq questions b, d, e, f et g dans le cas où la lumière incidente 
est composée de photons non-polarisés. 


Donner un exemple physique de lumière non-polarisée. 


Exercices et problèmes 


Photons polarisés, lame demi-onde 


Dans cet exercice, on examine l’effet combiné de polariseurs et d’une lame demi- 
onde sur des photons qu’on suppose polarisés rectilignement. Les vecteurs d’état |) 
et |[V) décrivent respectivement un photon polarisé horizontalement et verticalement. 


axe 
optique | 









| +a 
| 
| 





lame 
demi-onde 


Figure 3 - Une « lame demi-onde » (LDO) est un élément optique taillé dans un cristal 
biréfringent, c’est-à-dire possédant un axe privilégié qu’on appelle « axe optique ». Cet 
élément modifie la polarisation d’une onde lumineuse sans en altérer son intensité 
(contrairement à un polariseur par exemple). Ainsi, lorsqu'une onde lumineuse polarisée 
rectilignement traverse une lame demi-onde, il n’y a pas d'absorption et la direction de 
polarisation de l’onde sortante est symétrique de la direction de polarisation incidente 
par rapport à l’axe optique de la lame demi-onde. Dit autrement, si la polarisation de 
l'onde incidente fait un angle +a avec l’axe optique de la lame demi-onde, alors la 
polarisation de l’onde sortante fait un angle -«w avec cet axe optique. 


a) La polarisation des photons incidents fait un angle 4 avec l’horizontale. Don- 
ner l’expression du vecteur d’état [0) décrivant la polarisation de ces photons 
dans la base {|H),[V}}. 


b) On met, sur le trajet de ces photons, un premier polariseur P; faisant un angle 6; 
avec l'horizontale. 


15 Dunod, 


1. Donner le vecteur d'état |1) décrivant un photon transmis dans la base 
{14,1V)}. 


2. Donner la probabilité de passage d’un photon |0) à travers P; en fonction 
de 6h et 61. 


c) On enlève ce polariseur P; et on le remplace par une lame demi-onde « LDO » 
dont l’axe optique fait un angle 8, avec l’horizontale. 


1. Faire un schéma pour représenter les polarisations entrante et sortante ainsi 
que la lame demi-onde LDO. 
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2. Donner le vecteur d’état |2) décrivant la polarisation d’un photon transmis 
par LDO dans la base {|H) ,[V)}. 


d) On laisse la lame demi-onde en place, et on ajoute le polariseur P; (faisant 
toujours un angle 4, avec l’horizontale) après la lame demi-onde. 


1. Donner le vecteur d’état |[3) décrivant la polarisation d’un photon transmis 
par LDO et P; dans la base {|H), |[V)}. 


2. Donner la probabilité totale de passage d’un photon à travers ces deux élé- 
ments optiques (LDO et P;), d’abord sous la forme d’un produit scalaire 
d’états |), puis en fonction de 6, 61 et 6. 


3. Déterminer les angles 6 pour lesquels cette probabilité est maximale. 


e) On ajoute maintenant un deuxième polariseur P;, mais positionné « avant » la 
lame demi-onde LDO. Les deux polariseurs sont en configuration « croisée », 
c’est-à-dire que la direction passante du nouveau polariseur P; est orthogonale 
à celle du premier polariseur P;,. On fait alors tourner, à vitesse angulaire w 
constante, la direction de l’axe optique de la lame demi-onde intercalée entre 
les deux polariseurs : 4 = wt. La probabilité de passage d’un photon à travers 
l’ensemble de ces trois éléments optiques (P;, LDO et P;) varie donc périodi- 
quement dans le temps. 


1. Donner le vecteur d’état |4) décrivant la polarisation d’un photon transmis 
par P; seul dans la base {|A ,[V)}. 


2. Donner le vecteur d’état |5) décrivant la polarisation d’un photon transmis 
par P; et LDO seuls dans la base {|A}, |V}}. 


3. Donner le vecteur d’état |6) décrivant la polarisation d’un photon transmis 
par l’ensemble des trois éléments P;, LDO et P; dans la base {|H) ,[V)}. 


4. Donner la probabilité totale de passage d’un photon à travers ces trois élé- 
ments, d’abord sous la forme d’un produit scalaire d’états |i}, puis en fonc- 
tion des angles 6; du problème. 


5. Déterminer la période d’oscillation de cette probabilité en fonction de w. 


Photon et atome dans une cavité 


Des expériences récentes de physique quantique, qui ont valu le prix Nobel à S. Ha- 
roche, ont permis de piéger un photon entre deux miroirs (une cavité), et de tester 
sa présence en faisant passer des atomes uniques entre les deux miroirs. Le but de 
ce problème est de donner les ordres de grandeur de cette expérience, et d’analyser 
quelques-uns des états quantiques que l’on peut produire avec cette technique. 
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Atome (état Wy,) 


mr VAVAVe 
mél. M le 


Cavité 
Atome (état 4, ou W) 


Mesure de l’état 
quantique 


Photon piégé dans une cavité. Le dispositif central de l’expérience est une cavité : 
deux miroirs se faisant face, situés à 2,7 cm l’un de l’autre. 


a) 


b) 


C) 


d) 


e) 


Si l’on injecte de la lumière dans la cavité, elle se retrouve piégée en faisant 
des allers-retours entre les deux miroirs. Qu'est ce qui limite le temps pendant 
lequel la lumière reste piégée ? 


Pour que le photon reste piégé dans la cavité, il faut que l’onde associée soit 
résonnante avec la cavité, donc que la longueur entre les deux miroirs soit un 
multiple entier de sa longueur d’onde. Dans le cas présent, la longueur de la ca- 
vité est égale à trois fois la longueur d’onde du photon. Quelle est la fréquence 
du photon ? À quel domaine du spectre électromagnétique cela correspond-il ? 


Dans cette expérience, la lumière reste piégée en moyenne pendant 0,18 s. 
Quelle distance parcourt la lumière pendant ce temps ? Combien effectue-t-elle 
de rebonds sur chacun des miroirs avant de s’échapper ? 

Un atome pour détecter un amis On considère un atome dont l’électron 
le), d'énergie respective E, et E, 
bé Ey < Eë). On fait passer l suite travers la cavité (voir le dessin plus 
haut). 


L'état initial de l’atome est [ÿ1) = L (|g) + le)). Si on mesure l'énergie de 
l'atome, quelle est la probabilité de mesurer £, ? Et celle de mesurer £, ? 





Après son passage dans la cavité, l’état de l’atome devient |Y2} = 5 (lg) — le)) 
si un photon était présent dans la cavité, ou reste |ÿ,) sinon. En mesurant l’éner- 
gie de l’atome qui sort de la cavité, peut-on savoir si un photon était présent ou 
non ? 


Expliquer comment, en principe, il est possible de construire un appareil de 
mesure capable de discriminer entre |#1) et |Y). 
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8) 


h) 


j) 


L'ensemble du dispositif (passage de l’atome dans la cavité + mesure de l’état 
des atomes sortant de la cavité) est un appareil de mesure de la lumière dans la 
cavité. Quelle quantité physique mesure-t-il ? Quelles sont ses limitations ? 


Mesures et états possibles. On prépare maintenant la cavité avec un champ 


faible, de telle sorte que l’état du champ dans la cavité est |D) = ne [0) + V3 LEA 
où |0) représente l’état à zéro photon et |1) l’état à un photon. 


On utilise le dispositif décrit précédemment pour analyser l’état du champ dans 
la cavité. Quelle est la probabilité de mesurer l’atome dans l’état |) ? Et dans 
l’etat |Y2) ? 


On suppose qu’on a mesuré [f2). On fait passer un deuxième atome dans la 
cavité. Quelle est alors la probabilité de mesurer ce deuxième atome dans l’état 
l1) ? Et dans l’état [/) ? Justifier votre réponse. 


Dans l’expérience, on envoie à intervalles réguliers des atomes à travers la ca- 
vité, à un rythme de 900 atomes par seconde. Dans une réalisation particulière, 
on mesure les 450 premiers atomes dans l’état |[f2), puis tous les autres dans 
l’état [f1). En déduire le nombre de photons présents dans la cavité en fonction 
du temps, et comparer avec le temps donné en question 3. Commenter. 


Cryptographie quantique et espionnage 


Le but de cet exercice est de calculer en détail l’effet d’une attaque d’un espion sur 
un protocole de cryptographie quantique. 


On rappelle que lors d’un protocole de cryptographie quantique, « Alice » envoie des 
photons à « Bob ». La polarisation du photon est utilisée pour coder les informations 0 


ou I. 


Alice peut alors choisir de coder sur une base {Æ,V}, où H est 0 et V est 1, ou 


de coder sur une base {D,D}, où D est 0 et D est 1. On rappelle qu’en notation de 


Dirac |D) = ns (IV) + [H)) et 


a) 


b) 
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D} = + (IV) 1H). 

On suppose qu’ Alice envoie le bit 1 codé dans la base {Æ,V}. Par quel ket ce 
photon peut-il être représenté ? Bob fait sa mesure dans la même base, avec 
quelle probabilité va-t-il trouver 1 ? Et 0? 

S1 Bob avait fait sa mesure dans la base {D,D}, avec quelle probabilité aurait-il 
trouvé 1 (on demande de faire explicitement le calcul) ? Et 0 ? 


Comme, après le protocole, Alice et Bob ne conservent que les évènements pour 
lesquels 1ls ont utilisé la même base, on considère, pour faire le calcul, qu’Alice 
et Bob utilisent tous les deux systématiquement la même base {A,V}. 

Une espionne, « Eve », décide de mettre en œuvre une attaque. Pour cela, elle 
intercepte le photon émis par Alice et le mesure. Après sa mesure, Eve renvoie 
à Bob un photon correspondant à ce qu’elle a mesuré, en espérant ainsi ne pas 
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d) 


€) 


8) 


h) 


Exercices et problèmes 


être détectée par Bob ou Alice. Comme Alice, Eve a quatre possibilités pour 
émettre un photon : |A), |[V}, |D) ou D). 

On suppose d’abord qu’Eve effectue sa mesure dans la base {H,V}. Avec quelle 
probabilité mesurera- t-elle correctement le bit envoyé par Alice ? Justifier. 
Après sa mesure, Eve renvoie un photon correspondant à celui qu’elle a mesuré. 
S1 Alice avait envoyé 1 (1.e. [V}), avec quelle probabilité Eve va renvoyer |H) ou 
[V) ? Avec quelle probabilité Bob mesurera-t-1l correctement le bit envoyé par 
Alice ? Eve pourra-t-elle être détectée dans ce cas ? 

On suppose maintenant qu’Eve effectue sa mesure dans la base {D,D)}, et 
qu’Alice envoie toujours le bit 1. Avec quelle probabilité mesurera-t-elle 0 
ou 1 ? 

S1 Eve mesure 0, quel état quantique de photon va-t-elle envoyer à Bob ? Avec 
quelle probabilité Bob mesurera-t-1l le même bit que celui envoyé par Alice ? 
Qu'en serait-il si Eve avait mesuré 1 ? 

On cherche maintenant à faire un bilan complet. Sachant qu’Eve a une chance 
sur deux d’utiliser une base identique à celle d’Alice et Bob lors de sa mesure, 
avec quelle probabilité Bob mesurera correctement le bit envoyé par Alice ? 

À votre avis, comment doivent agir Alice et Bob pour détecter la présence 
d’Eve ? Comment prendre en compte le fait que même en absence d’Eve, 1l 
y a des erreurs expérimentales dues à l’imperfection des appareils ? 


Effet de la gravité sur la longueur d’onde d’un jet 
de neutrons 


Soit un jet de neutrons (my = 1,7.10?7 kg) vertical dirigé vers le haut suivant l’axe 
des z croissants. On donne sa longueur d’onde de de Broglie en z = 0 : 49 = 10 nm. 


a) 
b) 


c) 


Calculer la vitesse en z = 0 du jet. 


Donner l’expression de la variation relative de la longueur d’onde de de Broglie 
en fonction de z. On mettra le resultat sous la forme EE, 


Faire l’application numérique pour z = 1 m. 


Notion de Qubit, porte cCNOT 


Soient deux qubits, a et b, pouvant prendre les valeurs 0 ou 1 lors de leur mesure. 
Leurs états respectifs s'expriment de la façon suivante : 


_10)+11) 
V2 

[0)-11) 

bp} = 
b=— 


la) 


dans la base orthonormée {|0) , [1»} de l’espace des états du problème. 
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a) 


b) 


c) 


d) 


Question préliminaire : dans le cas où les vecteurs d’état |0) et |1) représentent 
les états de polarisation horizontal et vertical de photons polarisés, quelles sont 
les directions de polarisation des états |a) et |b) ? 


Exprimer l’état des deux qubits |ab) = |a)|b) en fonction des états [00), [01), 
110), [11) (où le premier chiffre représente l’état du qubit a et le second chiffre 
celui du qubit b), en utilisant la linéarité de l’espace de Hilbert des états de deux 
qubits. 


Dans une mesure du système dans l’état |ab}, quelle est la probabilité : 


1. que le qubit a ait la valeur 0 et le qubit b la valeur 1 ? 
2. que le qubit a ait la valeur 0 ? 


3. que les deux qubits aient des valeurs différentes ? 


La réalisation d’un calcul informatique nécessite de définir des « opérations 
logiques ». Un exemple important d'opération logique est la porte cNOT 
(controlled-NOT) qui agit sur un ensemble de deux qubits, le premier servant 
de « qubit de contrôle » pour changer, de façon conditionnelle, le second qubit, 
appelé « qubit cible ». L'opération est simple : si le qubit de contrôle (« a » dans 
notre cas) est dans l’état [0), le qubit cible («b » dans notre cas) n’est pas mo- 
difié ; par contre, si le qubit de contrôle est dans l’état |1), le qubit cible change 
d’état. Par exemple : 
CNOT 110) =1]11) 


1. Exprimer l’état CNOT |ab) en fonction des états |[00), |01), [10), |11). 


2. Dans une mesure du système dans l’état CNOT |ab), quelle est la probabi- 
lité que les deux qubits aient des valeurs différentes ? 


Particule dans un piège harmonique 


On considère un électron, de masse m et de quantité de mouvement p, piégé dans un 
potentiel de type oscillateur harmonique. En mécanique classique, on peut montrer 
que l’énergie potentielle de l’électron en fonction de sa position x est donnée par 


l 
E,(x) = mo x 


2, avec w la pulsation propre de l’oscillateur. 


On donne ñ = 1.107* J.s.rad"!, w = 6,4.108rad.s"! et e = 1,6.107!°C 


On cherche dans un premier temps à déterminer quelle est l’énergie minimale, en 
mécanique quantique, que peut prendre l’électron dans ce potentiel. 
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a) 
b) 


Écrire l’énergie totale E(x,p) de l’électron en fonction de w, m, x et p. 


Écrire la relation d’incertitude de Heisenberg Position-Quantité de mouvement 
à une dimension. 
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c) Les valeurs moyennes (x) et (p) étant nulles, on peut écrire que Ax = (x?) et 
Ap = 4(p°). En déduire d’après la relation de la question b que : 


2 


4(x2) 





(p°) > 


d) Écrire alors la valeur moyenne de l’énergie totale {E(x,p)) en fonction de (x2) 
et ( p°). Montrer que cette énergie possède une valeur minimale, £,,;,, que l’on 
exprimera. 

e) On peut montrer que, au minimum de l’énergie, on a (x?) = . Déterminer 

l'expression du minimum de l’énergie totale moyenne de l’électron E;,. Faire 


l’application numérique en J et en eV. 





En réalité, l’énergie totale accessible par l’électron est quantifiée dans le poten- 
tiel harmonique. Les énergies de l’électron sont données par E, = hw(n + à). 
avec ñ un entier naturel. L’état propre associé à chaque énergie Æ, est représenté 
par le ket |n). 


f) On prépare l’électron dans une superposition d’états |) = a|0) + b]1), avec a 
et b deux réels positifs. À quelle relation doivent obéir ces coefficients a et b? 


g) Si l’on fait une mesure unique de l’énergie du système, peut-on mesurer Shco ? 


h) Un ensemble de mesures de l’énergie montrent que l’on a quatre fois plus de 
chances de mesurer ÆQ que E;. En utilisant la réponse de la question f, détermi- 
ner les valeurs des coefficients a et b. 


1) Donner alors l’énergie moyenne £,,, du système en fonction de ñ et de w. Faire 
l'application numérique en eV. 
À chaque état |») on peut associer une fonction d’onde #,(x) qui est reliée à 
la position de la particule dans l’état considéré. Pour l’état fondamental |0), la 
fonction d’onde associée à l’électron est : 


mo ,2 
pot) = AeT 


où À est un paramètre indépendant de x. 


j) On se place dans l’état |0). Écrire la probabilité P de trouver la particule entre 
deux positions x1 et x2. 


k) Selon vous, cette probabilité évolue-t-elle avec le temps ? Justifier. 
1) Pour x; = —c et x2 = +0, que doit obligatoirement valoir cette probabilité P ? 


m) En déduire une expression du coefficient À. 


+00 
32 IT 
[ e* dx = ,]- 
De a 


On donne : 
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Évolution quantique et facteur de phase relatif 


On considère une particule libre de masse m se propageant dans la direction Ox. On 
appelle Æ son énergie totale, égale dans ce cas à son énergie cinétique. On appelle 
lÿ£) l’état quantique de la particule d’énergie E et Yg(x) = {xlWg) la fonction d’onde 
associée. 


a) 


b) 


c) 


d) 


Rappeler l’expression d’une onde classique réelle plane A(x,f) se propageant 
dans la direction Ox de vecteur d’onde k et de pulsation w. Donner l’expression 
complexe de la même onde, telle que A(x,r) = R(A(x,r)), R désignant la partie 
réelle (on donnera l’expression où le coefficient de f est imaginaire négatif). 


On fait l'hypothèse que la fonction d’onde y(x,r) décrivant la particule libre 
est identique à l’expression complexe A(x,f) de l’onde associée trouvée dans 
la question précédente. Rappeler les deux relations exprimant la dualité onde- 
corpuscule reliant vecteur d’onde et pulsation de l’onde à quantité de mouve- 
ment p et énergie E de la particule. Donner l’expression reliant E et p pour 
une particule libre classique. En déduire la relation liant pulsation et quantité de 
mouvement pour l’onde associée. 


Montrer qu’on a pour la fonction d’onde Y£(x,f) décrivant une particule d’éner- 
gie E : gx) = 6e Ehyg(x,0). En déduire que si à l’instant # = 0 la particule 
est décrite par le vecteur d’état [£), elle sera à tout instant ultérieur f décrite 
par le vecteur d'état lÿg(r)) = e TE lg). 


On suppose que la particule se trouve à l’instant f = 0 décrite par la fonction 


d’onde : 


V2 


avec E; # E2. Donner l’expression de Yo(x,f). 


Do(X) = —=(Yr, (x,0) + Yr,(x,0)) 


Calculer la probabilité de présence de la particule en un point x à tout instant f. 
Montrer que celle-ci évolue périodiquement. Exprimer la période en fonction 
de E;, E et h. 


On fait à l’instant f une mesure de l’énergie de la particule décrite par la fonction 
d’onde Yo(x,f). Quels sont les résultats possibles, et avec quelle probabilité ? 
Ces résultats dépendent-ils du temps ? 


Boîte quantique, effet de recul et horloge atomique 


On considère, dans ce problème, un système physique S de masse totale M dont 
on supposera qu’il peut se déplacer librement selon l’axe (Ox) d’un référentiel Ga- 
liléen R. Ce système est susceptible d’absorber un photon de fréquence y dont la 
direction de propagation est suivant (Ox). Après absorption, le photon a disparu. 
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a) 


b) 


c) 


d) 


Exercices et problèmes 


. Donner la définition de l’énergie interne en relativité. Rappeler les expres- 


sions de l’énergie cinétique, de l’énergie interne et de l’énergie totale rela- 
tivistes. La vitesse de S par rapport à O dans le référentiel À sera notée v. 


. Dans quelles circonstances la masse d’un système physique est-elle sus- 


ceptible de changer ? Donner un exemple. 


. Quelle est la formule reliant énergie totale, quantité de mouvement et 


masse en relativité ? 


. Donner l’expression de la quantité de mouvement du photon en fonction 


de sa fréquence v. 


. On suppose tout d’abord que S est une particule élémentaire, comme 


l’électron, sans structure interne. Que peut-on dire de sa masse ? 


. Avant l’absorption du photon, S est supposé au repos, et son énergie to- 


tale vaut E. Après absorption, p’ est sa quantité de mouvement (selon Ox) 
et E’ son énergie totale. Écrire les conservations de l’énergie et de la com- 
posante le long de (Ox) de la quantité de mouvement dans le processus 
d'absorption du photon. 


. Montrer que ces deux équations ne peuvent pas être simultanément satis- 


faites. Conclusion ? 


. $ est maintenant un système ayant une structure interne, un atome ou une 


boîte quantique par exemple. Cette structure est susceptible de changer lors 
de l’absorption du photon. On appelle respectivement M et M’ sa masse 
avant et après son interaction avec le photon. Écrire à nouveau les conser- 
vations de l’énergie et de la composante le long de (Ox) de la quantité 
de mouvement dans le processus d’absorption du photon par l’atome, en 
supposant toujours l’atome initialement au repos. 


. Montrer que ces deux équations peuvent maintenant être simultanément 


satisfaites, et donner l’équation permettant de déterminer M” à partir de M 
et y. 


. On suppose que M” est proche de M, et on pose M’ = M + 6M. Trouver 


ÔM par un développement limité à l’ordre le plus bas. Quelle est la vitesse v 
(supposée petite devant c) acquise par S après absorption ? 


. Déterminer numériquement ÔM et v pour un photon jaune de longueur 


d’onde À = 0.6 um et un système de masse M = 1077 kg. Les hypothèses 
utilisées sont elles vérifiées ? 


. Le système mobile à structure interne S a maintenant des propriétés quan- 


tiques : c’est par exemple une boîte quantique, ou un atome. Pour simpli- 
fier, S est traité comme une boîte quantique à une dimension de masse M 
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e) 


enfermant une particule de masse m << M dans un puits de potentiel in- 
fini à une dimension de largeur a. Quelles sont les longueurs d’onde pos- 
sibles de l’onde de de Broglie associée à la particule enfermée dans la boîte 
quantique ? L'énergie de cette particule peut-elle prendre n’importe quelle 
valeur ? Rappeler brièvement le raisonnement qui permet de déterminer 
l’énergie des deux premiers états Æ, et E2 de la boîte quantique et donner 
leur expression. On pose E3 — Ej = hvo. 


. Déterminer numériquement à 1 % près vo pour m = 107% kg, a = 107? m. 


. On revient au problème de l’absorption du photon par la boîte quantique 


susceptible de se déplacer dans son ensemble et initialement dans son état 
interne de plus basse énergie E1. À cause de la quantification de l’énergie 
étudiée dans la question d.I la boîte après absorption du photon se trouve 
dans son état excité d’énergie E>, et sa masse après absorption ne peut 
prendre que la valeur M’ = M + hvo/c’. Déduire de la question c.2 que la 
fréquence du photon susceptible d’être absorbé par la boîte quantique libre 
de se déplacer est donnée par : 


o) 
Av 
2Mc2 
Justifier le nom d’« effet de recul » donné à cet effet. 





Y = Vo + 


. La précision relative actuelle des mesures de fréquence de la lumière est 


de 107!2, L’effet de recul est-il mesurable avec la valeur numérique déjà 
trouvée pour vo et M = 1077 kg ? 


. On appelle respectivement |, > et [ÿ2 > les états quantiques de la boîte 


quantique d’énergies respectives E; et E>, et on dispose d’un dispositif de 
mesure de cette énergie sur chaque boîte quantique individuelle. On peut 
ajuster les propriétés de la lumière absorbée par la boîte pour que l’état de 
la boîte après absorption, à f = 0, soit : 


>= cos 0, > + sin 0[f > 


Déterminer la probabilité de trouver la boîte dans son niveau d’énergie E. 
Dans quel état se trouvera le système après la mesure ? Pour quelles valeurs 
de 4 peut-on prédire avec certitude le résultat d’une mesure d’énergie sur 
une boîte donnée ? 


. En déduire l’énergie moyenne Æ du système lorsqu'on effectue un très 


grand nombre de mesures successives sur des boîtes quantiques identiques 
toutes préparées dans l’état | >. Déterminer aussi l’incertitude de cette 
mesure, en calculant sa variance AE? = (E?) — (EŸ. Pour quelle valeur de 
0 l'incertitude est-elle maximale ? minimale ? 
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Exercices et problèmes 


f) Vous disposez d’une boîte quantique, d’une source de photons de fréquence 
contrôlable, et d’un dispositif de mesure de l’énergie de la boîte après interac- 
tion avec les photons. Indiquez comment construire à partir de ces éléments une 
source de lumière de fréquence parfaitement contrôlée (« horloge atomique »). 
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